ai-gateway/relay/controller/text.go

package controller

import (
	"bytes"
	"encoding/json"
	"fmt"
	"github.com/gin-gonic/gin"
	"github.com/songquanpeng/one-api/common"
	"github.com/songquanpeng/one-api/common/logger"
	"github.com/songquanpeng/one-api/relay/channel/openai"
	"github.com/songquanpeng/one-api/relay/constant"
	"github.com/songquanpeng/one-api/relay/helper"
	"github.com/songquanpeng/one-api/relay/model"
	"github.com/songquanpeng/one-api/relay/util"
	"io"
	"net/http"
	"strings"
)

func RelayTextHelper(c *gin.Context) *model.ErrorWithStatusCode {
	ctx := c.Request.Context()
	meta := util.GetRelayMeta(c)
	// get & validate textRequest
	textRequest, err := getAndValidateTextRequest(c, meta.Mode)
	if err != nil {
		logger.Errorf(ctx, "getAndValidateTextRequest failed: %s", err.Error())
		return openai.ErrorWrapper(err, "invalid_text_request", http.StatusBadRequest)
	}
	meta.IsStream = textRequest.Stream

	// map model name
	var isModelMapped bool
	meta.OriginModelName = textRequest.Model
	textRequest.Model, isModelMapped = util.GetMappedModelName(textRequest.Model, meta.ModelMapping)
	meta.ActualModelName = textRequest.Model
	// get model ratio & group ratio
	modelRatio := common.GetModelRatio(textRequest.Model)
	groupRatio := common.GetGroupRatio(meta.Group)
	ratio := modelRatio * groupRatio
	// pre-consume quota
	promptTokens := getPromptTokens(textRequest, meta.Mode)
	meta.PromptTokens = promptTokens
	preConsumedQuota, bizErr := preConsumeQuota(ctx, textRequest, promptTokens, ratio, meta)
	if bizErr != nil {
		logger.Warnf(ctx, "preConsumeQuota failed: %+v", *bizErr)
		return bizErr
	}

	adaptor := helper.GetAdaptor(meta.APIType)
	if adaptor == nil {
		return openai.ErrorWrapper(fmt.Errorf("invalid api type: %d", meta.APIType), "invalid_api_type", http.StatusBadRequest)
	}

	// get request body
	var requestBody io.Reader
	if meta.APIType == constant.APITypeOpenAI {
		// no need to convert request for openai
		shouldResetRequestBody := isModelMapped || meta.ChannelType == common.ChannelTypeBaichuan // frequency_penalty 0 is not acceptable for baichuan
		if shouldResetRequestBody {
			jsonStr, err := json.Marshal(textRequest)
			if err != nil {
				return openai.ErrorWrapper(err, "json_marshal_failed", http.StatusInternalServerError)
			}
			requestBody = bytes.NewBuffer(jsonStr)
		} else {
			requestBody = c.Request.Body
		}
	} else {
		convertedRequest, err := adaptor.ConvertRequest(c, meta.Mode, textRequest)
		if err != nil {
			return openai.ErrorWrapper(err, "convert_request_failed", http.StatusInternalServerError)
		}
		jsonData, err := json.Marshal(convertedRequest)
		if err != nil {
			return openai.ErrorWrapper(err, "json_marshal_failed", http.StatusInternalServerError)
		}
		requestBody = bytes.NewBuffer(jsonData)
	}

	// do request
	resp, err := adaptor.DoRequest(c, meta, requestBody)
	if err != nil {
		logger.Errorf(ctx, "DoRequest failed: %s", err.Error())
		return openai.ErrorWrapper(err, "do_request_failed", http.StatusInternalServerError)
	}
	errorHappened := (resp.StatusCode != http.StatusOK) || (meta.IsStream && resp.Header.Get("Content-Type") == "application/json")
	if errorHappened {
		util.ReturnPreConsumedQuota(ctx, preConsumedQuota, meta.TokenId)
		return util.RelayErrorHandler(resp)
	}
	meta.IsStream = meta.IsStream || strings.HasPrefix(resp.Header.Get("Content-Type"), "text/event-stream")

	// do response
	usage, respErr := adaptor.DoResponse(c, resp, meta)
	if respErr != nil {
		logger.Errorf(ctx, "respErr is not nil: %+v", respErr)
		util.ReturnPreConsumedQuota(ctx, preConsumedQuota, meta.TokenId)
		return respErr
	}
	// post-consume quota
	go postConsumeQuota(ctx, usage, meta, textRequest, ratio, preConsumedQuota, modelRatio, groupRatio)
	return nil
}
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`package controller`

			`import (`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`"bytes"`
			`"encoding/json"`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`"fmt"`
refactor: refactor relay part (#935) 2024-01-14 11:21:03 +00:00			`"github.com/gin-gonic/gin"`
chore: update module name 2024-01-28 11:38:58 +00:00			`"github.com/songquanpeng/one-api/common"`
			`"github.com/songquanpeng/one-api/common/logger"`
			`"github.com/songquanpeng/one-api/relay/channel/openai"`
			`"github.com/songquanpeng/one-api/relay/constant"`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`"github.com/songquanpeng/one-api/relay/helper"`
			`"github.com/songquanpeng/one-api/relay/model"`
chore: update module name 2024-01-28 11:38:58 +00:00			`"github.com/songquanpeng/one-api/relay/util"`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`"io"`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`"net/http"`
			`"strings"`
			`)`

refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`func RelayTextHelper(c gin.Context) model.ErrorWithStatusCode {`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`ctx := c.Request.Context()`
			`meta := util.GetRelayMeta(c)`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// get & validate textRequest`
			`textRequest, err := getAndValidateTextRequest(c, meta.Mode)`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`if err != nil {`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`logger.Errorf(ctx, "getAndValidateTextRequest failed: %s", err.Error())`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`return openai.ErrorWrapper(err, "invalid_text_request", http.StatusBadRequest)`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`}`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`meta.IsStream = textRequest.Stream`

refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// map model name`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`var isModelMapped bool`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`meta.OriginModelName = textRequest.Model`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`textRequest.Model, isModelMapped = util.GetMappedModelName(textRequest.Model, meta.ModelMapping)`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`meta.ActualModelName = textRequest.Model`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// get model ratio & group ratio`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`modelRatio := common.GetModelRatio(textRequest.Model)`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`groupRatio := common.GetGroupRatio(meta.Group)`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`ratio := modelRatio * groupRatio`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// pre-consume quota`
			`promptTokens := getPromptTokens(textRequest, meta.Mode)`
fix: fix prompt token is zero (close #1023) 2024-02-21 14:19:42 +00:00			`meta.PromptTokens = promptTokens`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`preConsumedQuota, bizErr := preConsumeQuota(ctx, textRequest, promptTokens, ratio, meta)`
			`if bizErr != nil {`
			`logger.Warnf(ctx, "preConsumeQuota failed: %+v", *bizErr)`
			`return bizErr`
fix: update cache immediately after cache get Co-authored-by: chikasaki <1347283135@qq.com> Co-authored-by: Cruel <157922018@qq.com> 2023-08-16 15:40:24 +00:00			`}`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`adaptor := helper.GetAdaptor(meta.APIType)`
			`if adaptor == nil {`
			`return openai.ErrorWrapper(fmt.Errorf("invalid api type: %d", meta.APIType), "invalid_api_type", http.StatusBadRequest)`
feat: support claude now (close #150) 2023-07-22 08:18:03 +00:00			`}`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00
			`// get request body`
			`var requestBody io.Reader`
			`if meta.APIType == constant.APITypeOpenAI {`
			`// no need to convert request for openai`
feat: support baichuan's models now (close #1057) 2024-03-01 16:55:48 +00:00			`shouldResetRequestBody := isModelMapped \|\| meta.ChannelType == common.ChannelTypeBaichuan // frequency_penalty 0 is not acceptable for baichuan`
			`if shouldResetRequestBody {`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`jsonStr, err := json.Marshal(textRequest)`
			`if err != nil {`
			`return openai.ErrorWrapper(err, "json_marshal_failed", http.StatusInternalServerError)`
			`}`
			`requestBody = bytes.NewBuffer(jsonStr)`
			`} else {`
			`requestBody = c.Request.Body`
			`}`
			`} else {`
			`convertedRequest, err := adaptor.ConvertRequest(c, meta.Mode, textRequest)`
feat: support xunfei's llm (close #206) 2023-07-29 13:55:57 +00:00			`if err != nil {`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`return openai.ErrorWrapper(err, "convert_request_failed", http.StatusInternalServerError)`
feat: support claude now (close #150) 2023-07-22 08:18:03 +00:00			`}`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`jsonData, err := json.Marshal(convertedRequest)`
feat: support xunfei's llm (close #206) 2023-07-29 13:55:57 +00:00			`if err != nil {`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`return openai.ErrorWrapper(err, "json_marshal_failed", http.StatusInternalServerError)`
feat: support ali's llm (close #326) 2023-07-28 15:45:08 +00:00			`}`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`requestBody = bytes.NewBuffer(jsonData)`
			`}`
feat: support xunfei's llm (close #206) 2023-07-29 13:55:57 +00:00
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`// do request`
			`resp, err := adaptor.DoRequest(c, meta, requestBody)`
			`if err != nil {`
			`logger.Errorf(ctx, "DoRequest failed: %s", err.Error())`
			`return openai.ErrorWrapper(err, "do_request_failed", http.StatusInternalServerError)`
fix: empty completion issue caused by bad status code from upstream channel (#422) 2023-08-19 09:58:45 +00:00			`}`
chore: able to search channel now 2024-03-10 06:59:57 +00:00			`errorHappened := (resp.StatusCode != http.StatusOK) \|\| (meta.IsStream && resp.Header.Get("Content-Type") == "application/json")`
			`if errorHappened {`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`util.ReturnPreConsumedQuota(ctx, preConsumedQuota, meta.TokenId)`
			`return util.RelayErrorHandler(resp)`
			`}`
chore: able to search channel now 2024-03-10 06:59:57 +00:00			`meta.IsStream = meta.IsStream \|\| strings.HasPrefix(resp.Header.Get("Content-Type"), "text/event-stream")`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// do response`
refactor: use adaptor to do relay & test 2024-02-17 16:15:31 +00:00			`usage, respErr := adaptor.DoResponse(c, resp, meta)`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`if respErr != nil {`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`logger.Errorf(ctx, "respErr is not nil: %+v", respErr)`
			`util.ReturnPreConsumedQuota(ctx, preConsumedQuota, meta.TokenId)`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`return respErr`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`}`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// post-consume quota`
			`go postConsumeQuota(ctx, usage, meta, textRequest, ratio, preConsumedQuota, modelRatio, groupRatio)`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`return nil`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`}`