perf: use max_tokens to reduce token consuming

2023-05-16 16:22:25 +08:00 · 2023-05-16 16:22:25 +08:00 · 58fe923c85
commit 58fe923c85
parent c9ac5e391f
2 changed files with 6 additions and 4 deletions
--- a/controller/channel.go
+++ b/controller/channel.go
@ -210,11 +210,12 @@ func testChannel(channel *model.Channel, request *ChatRequest) error {
 func buildTestRequest(c *gin.Context) *ChatRequest {
 	model_ := c.Query("model")
 	testRequest := &ChatRequest{
-		Model: model_,
+		Model:     model_,
+		MaxTokens: 1,
 	}
 	testMessage := Message{
 		Role:    "user",
-		Content: "echo hi",
+		Content: "hi",
 	}
 	testRequest.Messages = append(testRequest.Messages, testMessage)
 	return testRequest
--- a/controller/relay.go
+++ b/controller/relay.go
@ -21,8 +21,9 @@ type Message struct {
 }

 type ChatRequest struct {
-	Model    string    `json:"model"`
-	Messages []Message `json:"messages"`
+	Model     string    `json:"model"`
+	Messages  []Message `json:"messages"`
+	MaxTokens int       `json:"max_tokens"`
 }

 type TextRequest struct {