fmt

2025-09-10 03:44:54 +00:00 · 2023-04-09 20:18:37 +02:00 · 2023-04-09 20:18:37 +02:00 · 7451196a78
commit 7451196a78
parent 3795c19dcb
1 changed files with 69 additions and 69 deletions
--- a/router/src/server.rs
+++ b/router/src/server.rs
@ -87,21 +87,21 @@ async fn health(infer: Extension<Infer>) -> Result<(), (StatusCode, Json<ErrorRe
 /// Generate tokens
 #[utoipa::path(
-post,
+    post,
-tag = "Text Generation Inference",
+    tag = "Text Generation Inference",
-path = "/generate",
+    path = "/generate",
-request_body = GenerateRequest,
+    request_body = GenerateRequest,
-responses(
+    responses(
-(status = 200, description = "Generated Text", body = GenerateResponse),
+        (status = 200, description = "Generated Text", body = GenerateResponse),
-(status = 424, description = "Generation Error", body = ErrorResponse,
+        (status = 424, description = "Generation Error", body = ErrorResponse,
-example = json ! ({"error": "Request failed during generation"})),
+            example = json ! ({"error": "Request failed during generation"})),
-(status = 429, description = "Model is overloaded", body = ErrorResponse,
+        (status = 429, description = "Model is overloaded", body = ErrorResponse,
-example = json ! ({"error": "Model is overloaded"})),
+            example = json ! ({"error": "Model is overloaded"})),
-(status = 422, description = "Input validation error", body = ErrorResponse,
+        (status = 422, description = "Input validation error", body = ErrorResponse,
-example = json ! ({"error": "Input validation error"})),
+            example = json ! ({"error": "Input validation error"})),
-(status = 500, description = "Incomplete generation", body = ErrorResponse,
+        (status = 500, description = "Incomplete generation", body = ErrorResponse,
-example = json ! ({"error": "Incomplete generation"})),
+            example = json ! ({"error": "Incomplete generation"})),
-)
+    )
 )]
 #[instrument(
    skip(infer),
@ -264,26 +264,26 @@ async fn generate(
 /// Generate a stream of token using Server-Sent Events
 #[utoipa::path(
-post,
+    post,
-tag = "Text Generation Inference",
+    tag = "Text Generation Inference",
-path = "/generate_stream",
+    path = "/generate_stream",
-request_body = GenerateRequest,
+    request_body = GenerateRequest,
-responses(
+    responses(
-(status = 200, description = "Generated Text", body = StreamResponse,
+        (status = 200, description = "Generated Text", body = StreamResponse,
-content_type = "text/event-stream"),
+            content_type = "text/event-stream"),
-(status = 424, description = "Generation Error", body = ErrorResponse,
+        (status = 424, description = "Generation Error", body = ErrorResponse,
-example = json ! ({"error": "Request failed during generation"}),
+            example = json ! ({"error": "Request failed during generation"}),
-content_type = "text/event-stream"),
+            content_type = "text/event-stream"),
-(status = 429, description = "Model is overloaded", body = ErrorResponse,
+        (status = 429, description = "Model is overloaded", body = ErrorResponse,
-example = json ! ({"error": "Model is overloaded"}),
+            example = json ! ({"error": "Model is overloaded"}),
-content_type = "text/event-stream"),
+            content_type = "text/event-stream"),
-(status = 422, description = "Input validation error", body = ErrorResponse,
+        (status = 422, description = "Input validation error", body = ErrorResponse,
-example = json ! ({"error": "Input validation error"}),
+            example = json ! ({"error": "Input validation error"}),
-content_type = "text/event-stream"),
+            content_type = "text/event-stream"),
-(status = 500, description = "Incomplete generation", body = ErrorResponse,
+        (status = 500, description = "Incomplete generation", body = ErrorResponse,
-example = json ! ({"error": "Incomplete generation"}),
+            example = json ! ({"error": "Incomplete generation"}),
-content_type = "text/event-stream"),
+            content_type = "text/event-stream"),
-)
+    )
 )]
 #[instrument(
    skip(infer),
@ -447,10 +447,10 @@ async fn generate_stream(
 /// Prometheus metrics scrape endpoint
 #[utoipa::path(
-get,
+    get,
-tag = "Text Generation Inference",
+    tag = "Text Generation Inference",
-path = "/metrics",
+    path = "/metrics",
-responses((status = 200, description = "Prometheus Metrics", body = String))
+    responses((status = 200, description = "Prometheus Metrics", body = String))
 )]
 async fn metrics(prom_handle: Extension<PrometheusHandle>) -> String {
    prom_handle.render()
@ -476,36 +476,36 @@ pub async fn run(
    // OpenAPI documentation
    #[derive(OpenApi)]
    #[openapi(
-    paths(
+        paths(
-    generate,
+            generate,
-    generate_stream,
+            generate_stream,
-    metrics,
+            metrics,
-    ),
+        ),
-    components(
+        components(
-    schemas(
+            schemas(
-    GenerateRequest,
+                GenerateRequest,
-    GenerateParameters,
+                GenerateParameters,
-    PrefillToken,
+                PrefillToken,
-    Token,
+                Token,
-    GenerateResponse,
+                GenerateResponse,
-    BestOfSequence,
+                BestOfSequence,
-    Details,
+                Details,
-    FinishReason,
+                FinishReason,
-    StreamResponse,
+                StreamResponse,
-    StreamDetails,
+                StreamDetails,
-    ErrorResponse,
+                ErrorResponse,
-    )
+            )
-    ),
+        ),
-    tags(
+        tags(
-    (name = "Text Generation Inference", description = "Hugging Face Text Generation Inference API")
+            (name = "Text Generation Inference", description = "Hugging Face Text Generation Inference API")
-    ),
+        ),
-    info(
+        info(
-    title = "Text Generation Inference",
+            title = "Text Generation Inference",
-    license(
+            license(
-    name = "Apache 2.0",
+                name = "Apache 2.0",
-    url = "https://www.apache.org/licenses/LICENSE-2.0"
+                url = "https://www.apache.org/licenses/LICENSE-2.0"
-    )
+            )
-    )
+        )
    )]
    struct ApiDoc;