Tokenization route.

2025-09-11 04:14:52 +00:00 · 2024-01-23 14:55:29 +01:00 · 2024-01-23 14:55:29 +01:00 · c12ff38974
commit c12ff38974
parent 4f7f617e91
1 changed files with 5 additions and 3 deletions
--- a/router/src/server.rs
+++ b/router/src/server.rs
@ -528,11 +528,11 @@ async fn generate_stream_internal(
 /// Generate tokens
 #[utoipa::path(
    post,
-    tag = "Chat completions",
+    tag = "Text Generation Inference",
    path = "/v1/chat/completions",
    request_body = ChatRequest,
    responses(
-    (status = 200, description = "Generated Text", body = GenerateResponse),
+    (status = 200, description = "Generated Text", body = ChatCompletionChunk),
    (status = 424, description = "Generation Error", body = ErrorResponse,
    example = json ! ({"error": "Request failed during generation"})),
    (status = 429, description = "Model is overloaded", body = ErrorResponse,
@ -675,7 +675,7 @@ async fn chat_completions(
 /// Tokenize inputs
 #[utoipa::path(
    post,
-    tag = "Tokenize",
+    tag = "Text Generation Inference",
    path = "/tokenize",
    request_body = TokenizeRequest,
    responses(
@ -765,6 +765,8 @@ pub async fn run(
    compat_generate,
    generate,
    generate_stream,
    chat_completions,
    tokenize,
    metrics,
    ),
    components(