fmt

2025-09-09 19:34:53 +00:00 · 2023-04-06 20:09:21 +02:00 · 2023-04-06 20:09:21 +02:00 · e4ad3066bc
commit e4ad3066bc
parent 1111125092
1 changed files with 6 additions and 2 deletions
--- a/server/text_generation_server/models/flash_llama.py
+++ b/server/text_generation_server/models/flash_llama.py
@ -39,7 +39,9 @@ class FlashLlama(FlashCausalLM):
            raise NotImplementedError("FlashLlama does not support quantization")
        tokenizer = LlamaTokenizer.from_pretrained(
-            model_id, revision=revision, padding_side="left",
+            model_id,
            revision=revision,
            padding_side="left",
        )
        config = AutoConfig.from_pretrained(
@ -155,7 +157,9 @@ class FlashLlamaSharded(FlashLlama):
            raise NotImplementedError("FlashLlama does not support quantization")
        tokenizer = LlamaTokenizer.from_pretrained(
-            model_id, revision=revision, padding_side="left",
+            model_id,
            revision=revision,
            padding_side="left",
        )
        config = AutoConfig.from_pretrained(