fmt

2025-09-09 11:24:53 +00:00 · 2023-04-06 20:09:21 +02:00 · 2023-04-06 20:09:21 +02:00 · e4ad3066bc
commit e4ad3066bc
parent 1111125092
1 changed files with 6 additions and 2 deletions
--- a/server/text_generation_server/models/flash_llama.py
+++ b/server/text_generation_server/models/flash_llama.py
@ -39,7 +39,9 @@ class FlashLlama(FlashCausalLM):
            raise NotImplementedError("FlashLlama does not support quantization")

        tokenizer = LlamaTokenizer.from_pretrained(
-            model_id, revision=revision, padding_side="left",
+            model_id,
+            revision=revision,
+            padding_side="left",
        )

        config = AutoConfig.from_pretrained(
@ -155,7 +157,9 @@ class FlashLlamaSharded(FlashLlama):
            raise NotImplementedError("FlashLlama does not support quantization")

        tokenizer = LlamaTokenizer.from_pretrained(
-            model_id, revision=revision, padding_side="left",
+            model_id,
+            revision=revision,
+            padding_side="left",
        )

        config = AutoConfig.from_pretrained(