Update Gradio snippet.

2025-09-12 04:44:52 +00:00 · 2024-08-13 19:05:47 +02:00 · 2024-08-13 19:05:47 +02:00 · d59df84169
commit d59df84169
parent 6e00e05cec
1 changed files with 12 additions and 2 deletions
--- a/docs/source/basic_tutorials/consuming_tgi.md
+++ b/docs/source/basic_tutorials/consuming_tgi.md
@ -127,8 +127,18 @@ client = InferenceClient(model="http://127.0.0.1:8080")
 def inference(message, history):
    partial_message = ""
-    for token in client.text_generation(message, max_new_tokens=20, stream=True):
+    output = client.chat.completions.create(
-        partial_message += token
+        model="tgi",
        messages=[
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": message},
        ],
        stream=True,
        max_tokens=1024,
    )
    for chunk in output:
        partial_message += chunk.choices[0].delta.content
        yield partial_message
 gr.ChatInterface(