Return prompt vs generated tokens.

2025-09-11 04:14:52 +00:00 · 2024-01-11 14:59:53 +00:00 · 2024-01-11 14:59:53 +00:00 · 5c8cc964fa
commit 5c8cc964fa
parent da27fbdfdb
1 changed files with 6 additions and 0 deletions
--- a/router/src/server.rs
+++ b/router/src/server.rs
@ -170,6 +170,7 @@ async fn generate(
    };

    // Token details
+    let prompt_tokens = response.prefill.len();
    let details = match details {
        true => {
            // convert best_of_responses
@ -257,6 +258,11 @@ async fn generate(
        "x-time-per-token",
        time_per_token.as_millis().to_string().parse().unwrap(),
    );
+    headers.insert("x-prompt-tokens", prompt_tokens.into());
+    headers.insert(
+        "x-generated-tokens",
+        response.generated_text.generated_tokens.into(),
+    );

    // Metrics
    metrics::increment_counter!("tgi_request_success");