ai-gateway/controller/relay.go

package controller

import (
	"bytes"
	"context"
	"fmt"
	"github.com/gin-gonic/gin"
	"github.com/songquanpeng/one-api/common"
	"github.com/songquanpeng/one-api/common/config"
	"github.com/songquanpeng/one-api/common/helper"
	"github.com/songquanpeng/one-api/common/logger"
	"github.com/songquanpeng/one-api/middleware"
	dbmodel "github.com/songquanpeng/one-api/model"
	"github.com/songquanpeng/one-api/relay/constant"
	"github.com/songquanpeng/one-api/relay/controller"
	"github.com/songquanpeng/one-api/relay/model"
	"github.com/songquanpeng/one-api/relay/util"
	"io"
	"net/http"
)

// https://platform.openai.com/docs/api-reference/chat

func relay(c *gin.Context, relayMode int) *model.ErrorWithStatusCode {
	var err *model.ErrorWithStatusCode
	switch relayMode {
	case constant.RelayModeImagesGenerations:
		err = controller.RelayImageHelper(c, relayMode)
	case constant.RelayModeAudioSpeech:
		fallthrough
	case constant.RelayModeAudioTranslation:
		fallthrough
	case constant.RelayModeAudioTranscription:
		err = controller.RelayAudioHelper(c, relayMode)
	default:
		err = controller.RelayTextHelper(c)
	}
	return err
}

func Relay(c *gin.Context) {
	ctx := c.Request.Context()
	relayMode := constant.Path2RelayMode(c.Request.URL.Path)
	if config.DebugEnabled {
		requestBody, _ := common.GetRequestBody(c)
		logger.Debugf(ctx, "request body: %s", string(requestBody))
	}
	bizErr := relay(c, relayMode)
	if bizErr == nil {
		return
	}
	channelId := c.GetInt("channel_id")
	lastFailedChannelId := channelId
	channelName := c.GetString("channel_name")
	group := c.GetString("group")
	originalModel := c.GetString("original_model")
	go processChannelRelayError(ctx, channelId, channelName, bizErr)
	requestId := c.GetString(logger.RequestIdKey)
	retryTimes := config.RetryTimes
	if !shouldRetry(c, bizErr.StatusCode) {
		logger.Errorf(ctx, "relay error happen, status code is %d, won't retry in this case", bizErr.StatusCode)
		retryTimes = 0
	}
	for i := retryTimes; i > 0; i-- {
		channel, err := dbmodel.CacheGetRandomSatisfiedChannel(group, originalModel, i != retryTimes)
		if err != nil {
			logger.Errorf(ctx, "CacheGetRandomSatisfiedChannel failed: %w", err)
			break
		}
		logger.Infof(ctx, "using channel #%d to retry (remain times %d)", channel.Id, i)
		if channel.Id == lastFailedChannelId {
			continue
		}
		middleware.SetupContextForSelectedChannel(c, channel, originalModel)
		requestBody, err := common.GetRequestBody(c)
		c.Request.Body = io.NopCloser(bytes.NewBuffer(requestBody))
		bizErr = relay(c, relayMode)
		if bizErr == nil {
			return
		}
		channelId := c.GetInt("channel_id")
		lastFailedChannelId = channelId
		channelName := c.GetString("channel_name")
		go processChannelRelayError(ctx, channelId, channelName, bizErr)
	}
	if bizErr != nil {
		if bizErr.StatusCode == http.StatusTooManyRequests {
			bizErr.Error.Message = "当前分组上游负载已饱和，请稍后再试"
		}
		bizErr.Error.Message = helper.MessageWithRequestId(bizErr.Error.Message, requestId)
		c.JSON(bizErr.StatusCode, gin.H{
			"error": bizErr.Error,
		})
	}
}

func shouldRetry(c *gin.Context, statusCode int) bool {
	if _, ok := c.Get("specific_channel_id"); ok {
		return false
	}
	if statusCode == http.StatusTooManyRequests {
		return true
	}
	if statusCode/100 == 5 {
		return true
	}
	if statusCode == http.StatusBadRequest {
		return false
	}
	if statusCode/100 == 2 {
		return false
	}
	return true
}

func processChannelRelayError(ctx context.Context, channelId int, channelName string, err *model.ErrorWithStatusCode) {
	logger.Errorf(ctx, "relay error (channel #%d): %s", channelId, err.Message)
	// https://platform.openai.com/docs/guides/error-codes/api-errors
	if util.ShouldDisableChannel(&err.Error, err.StatusCode) {
		disableChannel(channelId, channelName, err.Message)
	}
}

func RelayNotImplemented(c *gin.Context) {
	err := model.Error{
		Message: "API not implemented",
		Type:    "one_api_error",
		Param:   "",
		Code:    "api_not_implemented",
	}
	c.JSON(http.StatusNotImplemented, gin.H{
		"error": err,
	})
}

func RelayNotFound(c *gin.Context) {
	err := model.Error{
		Message: fmt.Sprintf("Invalid URL (%s %s)", c.Request.Method, c.Request.URL.Path),
		Type:    "invalid_request_error",
		Param:   "",
		Code:    "",
	}
	c.JSON(http.StatusNotFound, gin.H{
		"error": err,
	})
}
Relay done but not working 2023-04-23 10:24:11 +00:00			`package controller`

			`import (`
fix: fix getAndValidateTextRequest failed: unexpected end of JSON input (close #1043) 2024-02-26 14:52:16 +00:00			`"bytes"`
feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`"context"`
Relay done but not working 2023-04-23 10:24:11 +00:00			`"fmt"`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`"github.com/gin-gonic/gin"`
fix: fix getAndValidateTextRequest failed: unexpected end of JSON input (close #1043) 2024-02-26 14:52:16 +00:00			`"github.com/songquanpeng/one-api/common"`
chore: update module name 2024-01-28 11:38:58 +00:00			`"github.com/songquanpeng/one-api/common/config"`
			`"github.com/songquanpeng/one-api/common/helper"`
			`"github.com/songquanpeng/one-api/common/logger"`
feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`"github.com/songquanpeng/one-api/middleware"`
			`dbmodel "github.com/songquanpeng/one-api/model"`
chore: update module name 2024-01-28 11:38:58 +00:00			`"github.com/songquanpeng/one-api/relay/constant"`
			`"github.com/songquanpeng/one-api/relay/controller"`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`"github.com/songquanpeng/one-api/relay/model"`
chore: update module name 2024-01-28 11:38:58 +00:00			`"github.com/songquanpeng/one-api/relay/util"`
fix: fix getAndValidateTextRequest failed: unexpected end of JSON input (close #1043) 2024-02-26 14:52:16 +00:00			`"io"`
Relay done but not working 2023-04-23 10:24:11 +00:00			`"net/http"`
			`)`

feat: PaLM support is WIP (#105) 2023-05-21 06:26:59 +00:00			`// https://platform.openai.com/docs/api-reference/chat`

feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`func relay(c gin.Context, relayMode int) model.ErrorWithStatusCode {`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`var err *model.ErrorWithStatusCode`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`switch relayMode {`
refactor: refactor relay part (#935) 2024-01-14 11:21:03 +00:00			`case constant.RelayModeImagesGenerations:`
			`err = controller.RelayImageHelper(c, relayMode)`
			`case constant.RelayModeAudioSpeech:`
feat: support tts model (#713) * Added support for Text-to-Speech models and endpoints * chore: update impl --------- Co-authored-by: JustSong <songquanpeng@foxmail.com> 2023-11-17 13:18:51 +00:00			`fallthrough`
refactor: refactor relay part (#935) 2024-01-14 11:21:03 +00:00			`case constant.RelayModeAudioTranslation:`
feat: support tts model (#713) * Added support for Text-to-Speech models and endpoints * chore: update impl --------- Co-authored-by: JustSong <songquanpeng@foxmail.com> 2023-11-17 13:18:51 +00:00			`fallthrough`
refactor: refactor relay part (#935) 2024-01-14 11:21:03 +00:00			`case constant.RelayModeAudioTranscription:`
			`err = controller.RelayAudioHelper(c, relayMode)`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`default:`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`err = controller.RelayTextHelper(c)`
feat: support /v1/completions (close #115) 2023-06-08 06:54:02 +00:00			`}`
feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`return err`
			`}`

			`func Relay(c *gin.Context) {`
			`ctx := c.Request.Context()`
			`relayMode := constant.Path2RelayMode(c.Request.URL.Path)`
feat: support baichuan's models now (close #1057) 2024-03-01 16:55:48 +00:00			`if config.DebugEnabled {`
			`requestBody, _ := common.GetRequestBody(c)`
			`logger.Debugf(ctx, "request body: %s", string(requestBody))`
			`}`
feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`bizErr := relay(c, relayMode)`
			`if bizErr == nil {`
			`return`
			`}`
			`channelId := c.GetInt("channel_id")`
			`lastFailedChannelId := channelId`
			`channelName := c.GetString("channel_name")`
			`group := c.GetString("group")`
			`originalModel := c.GetString("original_model")`
			`go processChannelRelayError(ctx, channelId, channelName, bizErr)`
			`requestId := c.GetString(logger.RequestIdKey)`
			`retryTimes := config.RetryTimes`
fix: fix getAndValidateTextRequest failed: unexpected end of JSON input (close #1043) 2024-02-26 14:52:16 +00:00			`if !shouldRetry(c, bizErr.StatusCode) {`
			`logger.Errorf(ctx, "relay error happen, status code is %d, won't retry in this case", bizErr.StatusCode)`
feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`retryTimes = 0`
			`}`
			`for i := retryTimes; i > 0; i-- {`
feat: only use the top priority when first retry (#1048) 2024-03-03 14:16:34 +00:00			`channel, err := dbmodel.CacheGetRandomSatisfiedChannel(group, originalModel, i != retryTimes)`
feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`if err != nil {`
			`logger.Errorf(ctx, "CacheGetRandomSatisfiedChannel failed: %w", err)`
			`break`
feat: retry on failed (close #112) 2023-07-15 11:06:51 +00:00			`}`
feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`logger.Infof(ctx, "using channel #%d to retry (remain times %d)", channel.Id, i)`
			`if channel.Id == lastFailedChannelId {`
			`continue`
			`}`
			`middleware.SetupContextForSelectedChannel(c, channel, originalModel)`
fix: fix getAndValidateTextRequest failed: unexpected end of JSON input (close #1043) 2024-02-26 14:52:16 +00:00			`requestBody, err := common.GetRequestBody(c)`
			`c.Request.Body = io.NopCloser(bytes.NewBuffer(requestBody))`
feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`bizErr = relay(c, relayMode)`
			`if bizErr == nil {`
			`return`
chore: rewrite 429 prompt text (close #96) 2023-05-18 07:27:15 +00:00			`}`
fix: fix error log not recorded (close #83) 2023-05-17 12:20:48 +00:00			`channelId := c.GetInt("channel_id")`
feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`lastFailedChannelId = channelId`
			`channelName := c.GetString("channel_name")`
			`go processChannelRelayError(ctx, channelId, channelName, bizErr)`
			`}`
			`if bizErr != nil {`
			`if bizErr.StatusCode == http.StatusTooManyRequests {`
			`bizErr.Error.Message = "当前分组上游负载已饱和，请稍后再试"`
feat: automatically disable channel when error occurred (#59) 2023-05-15 09:34:09 +00:00			`}`
feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`bizErr.Error.Message = helper.MessageWithRequestId(bizErr.Error.Message, requestId)`
			`c.JSON(bizErr.StatusCode, gin.H{`
			`"error": bizErr.Error,`
			`})`
			`}`
			`}`

fix: fix getAndValidateTextRequest failed: unexpected end of JSON input (close #1043) 2024-02-26 14:52:16 +00:00			`func shouldRetry(c *gin.Context, statusCode int) bool {`
			`if _, ok := c.Get("specific_channel_id"); ok {`
			`return false`
			`}`
feat: built in retry supported (close #1036, close #770) 2024-02-25 11:01:49 +00:00			`if statusCode == http.StatusTooManyRequests {`
			`return true`
			`}`
			`if statusCode/100 == 5 {`
			`return true`
			`}`
			`if statusCode == http.StatusBadRequest {`
			`return false`
			`}`
			`if statusCode/100 == 2 {`
			`return false`
			`}`
			`return true`
			`}`

			`func processChannelRelayError(ctx context.Context, channelId int, channelName string, err *model.ErrorWithStatusCode) {`
			`logger.Errorf(ctx, "relay error (channel #%d): %s", channelId, err.Message)`
			`// https://platform.openai.com/docs/guides/error-codes/api-errors`
			`if util.ShouldDisableChannel(&err.Error, err.StatusCode) {`
			`disableChannel(channelId, channelName, err.Message)`
refactor: improve relay's implementation 2023-04-28 09:11:57 +00:00			`}`
			`}`

feat: now use token as the unit of quota (close #33) 2023-04-28 08:58:55 +00:00			`func RelayNotImplemented(c *gin.Context) {`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`err := model.Error{`
fix: handel error response from server correctly (close #90) 2023-05-18 03:11:15 +00:00			`Message: "API not implemented",`
			`Type: "one_api_error",`
			`Param: "",`
			`Code: "api_not_implemented",`
			`}`
fix: fix http status code (close #193) 2023-06-23 14:59:44 +00:00			`c.JSON(http.StatusNotImplemented, gin.H{`
fix: handel error response from server correctly (close #90) 2023-05-18 03:11:15 +00:00			`"error": err,`
feat: now use token as the unit of quota (close #33) 2023-04-28 08:58:55 +00:00			`})`
			`}`
feat: return a not found response if requested a wrong API endpoints 2023-06-17 01:46:07 +00:00
			`func RelayNotFound(c *gin.Context) {`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`err := model.Error{`
fix: update no route handler 2023-08-11 11:53:01 +00:00			`Message: fmt.Sprintf("Invalid URL (%s %s)", c.Request.Method, c.Request.URL.Path),`
			`Type: "invalid_request_error",`
feat: return a not found response if requested a wrong API endpoints 2023-06-17 01:46:07 +00:00			`Param: "",`
fix: update no route handler 2023-08-11 11:53:01 +00:00			`Code: "",`
feat: return a not found response if requested a wrong API endpoints 2023-06-17 01:46:07 +00:00			`}`
fix: fix http status code (close #193) 2023-06-23 14:59:44 +00:00			`c.JSON(http.StatusNotFound, gin.H{`
feat: return a not found response if requested a wrong API endpoints 2023-06-17 01:46:07 +00:00			`"error": err,`
			`})`
			`}`