feat: add support for gemini embedding-001

2024-02-26 14:56:24 +08:00 · 2024-02-26 14:56:24 +08:00 · 7038d2a71b
commit 7038d2a71b
parent 6b27d6659a
5 changed files with 126 additions and 5 deletions
--- a/common/model-ratio.go
+++ b/common/model-ratio.go
@ -127,6 +127,7 @@ var ModelRatio = map[string]float64{
 	"moonshot-v1-8k":   0.012 * RMB,
 	"moonshot-v1-32k":  0.024 * RMB,
 	"moonshot-v1-128k": 0.06 * RMB,
+	"embedding-001":    0.01 * RMB,
 }

 func ModelRatio2JSONString() string {
--- a/relay/channel/gemini/adaptor.go
+++ b/relay/channel/gemini/adaptor.go
@ -7,6 +7,7 @@ import (
 	"github.com/songquanpeng/one-api/common/helper"
 	channelhelper "github.com/songquanpeng/one-api/relay/channel"
 	"github.com/songquanpeng/one-api/relay/channel/openai"
+	relaymode "github.com/songquanpeng/one-api/relay/constant"
 	"github.com/songquanpeng/one-api/relay/model"
 	"github.com/songquanpeng/one-api/relay/util"
 	"io"
@ -17,15 +18,19 @@ type Adaptor struct {
 }

 func (a *Adaptor) Init(meta *util.RelayMeta) {
-
+	fmt.Println(meta.APIVersion)
 }

 func (a *Adaptor) GetRequestURL(meta *util.RelayMeta) (string, error) {
 	version := helper.AssignOrDefault(meta.APIVersion, "v1")
 	action := "generateContent"
-	if meta.IsStream {
+
+	if relaymode.RelayModeEmbeddings == meta.Mode {
+		action = "batchEmbedContents"
+	} else if meta.IsStream {
 		action = "streamGenerateContent"
 	}
+
 	return fmt.Sprintf("%s/%s/models/%s:%s", meta.BaseURL, version, meta.ActualModelName, action), nil
 }

@ -39,7 +44,12 @@ func (a *Adaptor) ConvertRequest(c *gin.Context, relayMode int, request *model.G
 	if request == nil {
 		return nil, errors.New("request is nil")
 	}
-	return ConvertRequest(*request), nil
+
+	if relaymode.RelayModeEmbeddings == relayMode {
+		return ConvertEmbeddingRequest(*request), nil
+	} else {
+		return ConvertRequest(*request), nil
+	}
 }

 func (a *Adaptor) DoRequest(c *gin.Context, meta *util.RelayMeta, requestBody io.Reader) (*http.Response, error) {
@ -47,7 +57,9 @@ func (a *Adaptor) DoRequest(c *gin.Context, meta *util.RelayMeta, requestBody io
 }

 func (a *Adaptor) DoResponse(c *gin.Context, resp *http.Response, meta *util.RelayMeta) (usage *model.Usage, err *model.ErrorWithStatusCode) {
-	if meta.IsStream {
+	if relaymode.RelayModeEmbeddings == meta.Mode {
+		err, usage = EmbeddingHandler(c, resp, meta.PromptTokens, meta.ActualModelName)
+	} else if meta.IsStream {
 		var responseText string
 		err, responseText = StreamHandler(c, resp)
 		usage = openai.ResponseText2Usage(responseText, meta.ActualModelName, meta.PromptTokens)
--- a/relay/channel/gemini/constants.go
+++ b/relay/channel/gemini/constants.go
@ -3,4 +3,5 @@ package gemini
 var ModelList = []string{
 	"gemini-pro",
 	"gemini-pro-vision",
+	"(Gemini)embedding-001",
 }
--- a/relay/channel/gemini/main.go
+++ b/relay/channel/gemini/main.go
@ -25,7 +25,7 @@ const (
 	VisionMaxImageNum = 16
 )

-// Setting safety to the lowest possible values since Gemini is already powerless enough
+// ConvertRequest Setting safety to the lowest possible values since Gemini is already powerless enough
 func ConvertRequest(textRequest model.GeneralOpenAIRequest) *ChatRequest {
 	geminiRequest := ChatRequest{
 		Contents: make([]ChatContent, 0, len(textRequest.Messages)),
@ -122,6 +122,27 @@ func ConvertRequest(textRequest model.GeneralOpenAIRequest) *ChatRequest {
 	return &geminiRequest
 }

+// ConvertEmbeddingRequest converts a GeneralOpenAIRequest to an EmbeddingMultiRequest
+func ConvertEmbeddingRequest(textRequest model.GeneralOpenAIRequest) *EmbeddingMultiRequest {
+	inputs := textRequest.ParseInput()
+	requests := make([]EmbeddingRequest, 0, len(inputs))
+	for _, input := range inputs {
+		requests = append(requests, EmbeddingRequest{
+			Model: "models/embedding-001",
+			Content: ChatContent{
+				Parts: []Part{
+					{
+						Text: input,
+					},
+				},
+			},
+		})
+	}
+	return &EmbeddingMultiRequest{
+		Requests: requests,
+	}
+}
+
 type ChatResponse struct {
 	Candidates     []ChatCandidate    `json:"candidates"`
 	PromptFeedback ChatPromptFeedback `json:"promptFeedback"`
@ -258,6 +279,45 @@ func StreamHandler(c *gin.Context, resp *http.Response) (*model.ErrorWithStatusC
 	return nil, responseText
 }

+// EmbeddingHandler is a function that handles embedding requests
+func EmbeddingHandler(c *gin.Context, resp *http.Response, promptTokens int, modelName string) (*model.ErrorWithStatusCode, *model.Usage) {
+	body, err := io.ReadAll(resp.Body)
+	if err != nil {
+		return openai.ErrorWrapper(err, "unmarshal_response_body_failed", http.StatusInternalServerError), nil
+	}
+	var geminiError Error
+	err = json.Unmarshal(body, &geminiError)
+	if geminiError.Code != 0 || err != nil {
+		return &model.ErrorWithStatusCode{
+			Error: model.Error{
+				Message: geminiError.Message,
+				Type:    geminiError.Details[0].Type,
+				Param:   geminiError.Status,
+				Code:    geminiError.Code,
+			},
+			StatusCode: resp.StatusCode,
+		}, nil
+	}
+	var geminiResponse EmbeddingResponse
+	err = json.Unmarshal(body, &geminiResponse)
+	if err != nil {
+		return openai.ErrorWrapper(err, "unmarshal_response_body_failed", http.StatusInternalServerError), nil
+	}
+	err = resp.Body.Close()
+	if err != nil {
+		return openai.ErrorWrapper(err, "close_response_body_failed", http.StatusInternalServerError), nil
+	}
+	fullTextResponse := embeddingResponseGemini2OpenAI(&geminiResponse, promptTokens, modelName)
+	jsonResponse, err := json.Marshal(fullTextResponse)
+	if err != nil {
+		return openai.ErrorWrapper(err, "marshal_response_body_failed", http.StatusInternalServerError), nil
+	}
+	c.Writer.Header().Set("Content-Type", "application/json")
+	c.Writer.WriteHeader(resp.StatusCode)
+	_, err = c.Writer.Write(jsonResponse)
+	return nil, &fullTextResponse.Usage
+}
+
 func Handler(c *gin.Context, resp *http.Response, promptTokens int, modelName string) (*model.ErrorWithStatusCode, *model.Usage) {
 	responseBody, err := io.ReadAll(resp.Body)
 	if err != nil {
@ -301,3 +361,21 @@ func Handler(c *gin.Context, resp *http.Response, promptTokens int, modelName st
 	_, err = c.Writer.Write(jsonResponse)
 	return nil, &usage
 }
+
+func embeddingResponseGemini2OpenAI(geminiResponse *EmbeddingResponse, promptTokens int, modelName string) *openai.EmbeddingResponse {
+	data := make([]openai.EmbeddingResponseItem, 0, len(geminiResponse.Embeddings))
+
+	for index, embedding := range geminiResponse.Embeddings {
+		data = append(data, openai.EmbeddingResponseItem{
+			Object:    "embedding",
+			Embedding: embedding.Values,
+			Index:     index,
+		})
+	}
+	return &openai.EmbeddingResponse{
+		Object: "list",
+		Data:   data,
+		Model:  modelName,
+		Usage:  model.Usage{TotalTokens: promptTokens},
+	}
+}
--- a/relay/channel/gemini/model.go
+++ b/relay/channel/gemini/model.go
@ -39,3 +39,32 @@ type ChatGenerationConfig struct {
 	CandidateCount  int      `json:"candidateCount,omitempty"`
 	StopSequences   []string `json:"stopSequences,omitempty"`
 }
+
+type Error struct {
+	Code    int    `json:"code"`
+	Message string `json:"message"`
+	Status  string `json:"status"`
+	Details []struct {
+		Type     string            `json:"@type"`
+		Reason   string            `json:"reason"`
+		Domain   string            `json:"domain"`
+		Metadata map[string]string `json:"metadata"`
+	} `json:"details"`
+}
+
+type EmbeddingRequest struct {
+	Model   string      `json:"model"`
+	Content ChatContent `json:"content"`
+}
+
+type EmbeddingMultiRequest struct {
+	Requests []EmbeddingRequest `json:"requests"`
+}
+
+type EmbeddingResponse struct {
+	Embeddings []EmbeddingData `json:"embeddings"`
+}
+
+type EmbeddingData struct {
+	Values []float64 `json:"values"`
+}