ai-gateway/relay/controller/text.go

package controller

import (
	"fmt"
	"github.com/gin-gonic/gin"
	"net/http"
	"one-api/common"
	"one-api/common/logger"
	"one-api/relay/channel/openai"
	"one-api/relay/constant"
	"one-api/relay/util"
	"strings"
)

func RelayTextHelper(c *gin.Context) *openai.ErrorWithStatusCode {
	ctx := c.Request.Context()
	meta := util.GetRelayMeta(c)
	// get & validate textRequest
	textRequest, err := getAndValidateTextRequest(c, meta.Mode)
	if err != nil {
		logger.Errorf(ctx, "getAndValidateTextRequest failed: %s", err.Error())
		return openai.ErrorWrapper(err, "invalid_text_request", http.StatusBadRequest)
	}
	// map model name
	var isModelMapped bool
	textRequest.Model, isModelMapped = util.GetMappedModelName(textRequest.Model, meta.ModelMapping)
	// get model ratio & group ratio
	modelRatio := common.GetModelRatio(textRequest.Model)
	groupRatio := common.GetGroupRatio(meta.Group)
	ratio := modelRatio * groupRatio
	// pre-consume quota
	promptTokens := getPromptTokens(textRequest, meta.Mode)
	preConsumedQuota, bizErr := preConsumeQuota(ctx, textRequest, promptTokens, ratio, meta)
	if bizErr != nil {
		logger.Warnf(ctx, "preConsumeQuota failed: %+v", *bizErr)
		return bizErr
	}

	// get request body
	requestBody, err := GetRequestBody(c, *textRequest, isModelMapped, meta.APIType, meta.Mode)
	if err != nil {
		return openai.ErrorWrapper(err, "get_request_body_failed", http.StatusInternalServerError)
	}
	// do request
	var resp *http.Response
	isStream := textRequest.Stream
	if meta.APIType != constant.APITypeXunfei { // cause xunfei use websocket
		fullRequestURL, err := GetRequestURL(c.Request.URL.String(), meta, textRequest)
		if err != nil {
			logger.Error(ctx, fmt.Sprintf("util.GetRequestURL failed: %s", err.Error()))
			return openai.ErrorWrapper(fmt.Errorf("util.GetRequestURL failed"), "get_request_url_failed", http.StatusInternalServerError)
		}

		resp, err = doRequest(ctx, c, meta, isStream, fullRequestURL, requestBody)
		if err != nil {
			logger.Errorf(ctx, "doRequest failed: %s", err.Error())
			return openai.ErrorWrapper(err, "do_request_failed", http.StatusInternalServerError)
		}
		isStream = isStream || strings.HasPrefix(resp.Header.Get("Content-Type"), "text/event-stream")

		if resp.StatusCode != http.StatusOK {
			util.ReturnPreConsumedQuota(ctx, preConsumedQuota, meta.TokenId)
			return util.RelayErrorHandler(resp)
		}
	}
	// do response
	usage, respErr := DoResponse(c, textRequest, resp, meta.Mode, meta.APIType, isStream, promptTokens)
	if respErr != nil {
		logger.Errorf(ctx, "respErr is not nil: %+v", respErr)
		util.ReturnPreConsumedQuota(ctx, preConsumedQuota, meta.TokenId)
		return respErr
	}
	// post-consume quota
	go postConsumeQuota(ctx, usage, meta, textRequest, ratio, preConsumedQuota, modelRatio, groupRatio)
	return nil
}
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`package controller`

			`import (`
			`"fmt"`
refactor: refactor relay part (#935) 2024-01-14 11:21:03 +00:00			`"github.com/gin-gonic/gin"`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`"net/http"`
			`"one-api/common"`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`"one-api/common/logger"`
refactor: refactor relay part (#935) 2024-01-14 11:21:03 +00:00			`"one-api/relay/channel/openai"`
			`"one-api/relay/constant"`
			`"one-api/relay/util"`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`"strings"`
			`)`

refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`func RelayTextHelper(c gin.Context) openai.ErrorWithStatusCode {`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`ctx := c.Request.Context()`
			`meta := util.GetRelayMeta(c)`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// get & validate textRequest`
			`textRequest, err := getAndValidateTextRequest(c, meta.Mode)`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`if err != nil {`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`logger.Errorf(ctx, "getAndValidateTextRequest failed: %s", err.Error())`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`return openai.ErrorWrapper(err, "invalid_text_request", http.StatusBadRequest)`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`}`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// map model name`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`var isModelMapped bool`
			`textRequest.Model, isModelMapped = util.GetMappedModelName(textRequest.Model, meta.ModelMapping)`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// get model ratio & group ratio`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`modelRatio := common.GetModelRatio(textRequest.Model)`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`groupRatio := common.GetGroupRatio(meta.Group)`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`ratio := modelRatio * groupRatio`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// pre-consume quota`
			`promptTokens := getPromptTokens(textRequest, meta.Mode)`
			`preConsumedQuota, bizErr := preConsumeQuota(ctx, textRequest, promptTokens, ratio, meta)`
			`if bizErr != nil {`
			`logger.Warnf(ctx, "preConsumeQuota failed: %+v", *bizErr)`
			`return bizErr`
fix: update cache immediately after cache get Co-authored-by: chikasaki <1347283135@qq.com> Co-authored-by: Cruel <157922018@qq.com> 2023-08-16 15:40:24 +00:00			`}`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00
			`// get request body`
			`requestBody, err := GetRequestBody(c, *textRequest, isModelMapped, meta.APIType, meta.Mode)`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`if err != nil {`
			`return openai.ErrorWrapper(err, "get_request_body_failed", http.StatusInternalServerError)`
feat: support claude now (close #150) 2023-07-22 08:18:03 +00:00			`}`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// do request`
feat: support xunfei's llm (close #206) 2023-07-29 13:55:57 +00:00			`var resp *http.Response`
			`isStream := textRequest.Stream`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`if meta.APIType != constant.APITypeXunfei { // cause xunfei use websocket`
			`fullRequestURL, err := GetRequestURL(c.Request.URL.String(), meta, textRequest)`
feat: support xunfei's llm (close #206) 2023-07-29 13:55:57 +00:00			`if err != nil {`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`logger.Error(ctx, fmt.Sprintf("util.GetRequestURL failed: %s", err.Error()))`
			`return openai.ErrorWrapper(fmt.Errorf("util.GetRequestURL failed"), "get_request_url_failed", http.StatusInternalServerError)`
feat: support claude now (close #150) 2023-07-22 08:18:03 +00:00			`}`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00
			`resp, err = doRequest(ctx, c, meta, isStream, fullRequestURL, requestBody)`
feat: support xunfei's llm (close #206) 2023-07-29 13:55:57 +00:00			`if err != nil {`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`logger.Errorf(ctx, "doRequest failed: %s", err.Error())`
refactor: refactor relay part (#935) 2024-01-14 11:21:03 +00:00			`return openai.ErrorWrapper(err, "do_request_failed", http.StatusInternalServerError)`
feat: support ali's llm (close #326) 2023-07-28 15:45:08 +00:00			`}`
fix: fix stream mode determine related logic (close #360) 2023-08-06 10:09:00 +00:00			`isStream = isStream \|\| strings.HasPrefix(resp.Header.Get("Content-Type"), "text/event-stream")`
feat: support xunfei's llm (close #206) 2023-07-29 13:55:57 +00:00
fix: fix xunfei crash (#451) 2023-08-20 14:07:50 +00:00			`if resp.StatusCode != http.StatusOK {`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`util.ReturnPreConsumedQuota(ctx, preConsumedQuota, meta.TokenId)`
refactor: refactor relay part (#935) 2024-01-14 11:21:03 +00:00			`return util.RelayErrorHandler(resp)`
fix: fix xunfei crash (#451) 2023-08-20 14:07:50 +00:00			`}`
fix: empty completion issue caused by bad status code from upstream channel (#422) 2023-08-19 09:58:45 +00:00			`}`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// do response`
			`usage, respErr := DoResponse(c, textRequest, resp, meta.Mode, meta.APIType, isStream, promptTokens)`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`if respErr != nil {`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`logger.Errorf(ctx, "respErr is not nil: %+v", respErr)`
			`util.ReturnPreConsumedQuota(ctx, preConsumedQuota, meta.TokenId)`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`return respErr`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`}`
refactor: split RelayTextHelper function 2024-01-28 11:13:11 +00:00			`// post-consume quota`
			`go postConsumeQuota(ctx, usage, meta, textRequest, ratio, preConsumedQuota, modelRatio, groupRatio)`
refactor: refactor relay part (#957) * refactor: refactor relay part * refactor: refactor config part 2024-01-21 15:21:42 +00:00			`return nil`
refactor: split the relay controller 2023-06-19 02:28:55 +00:00			`}`