add improvements

2025-09-09 11:24:53 +00:00 · 2025-04-21 15:28:18 +00:00 · 2025-04-21 15:28:18 +00:00 · 6ed540b52f
commit 6ed540b52f
parent be8e60a918
1 changed files with 3 additions and 0 deletions
--- a/server/text_generation_server/models/flash_causal_lm.py
+++ b/server/text_generation_server/models/flash_causal_lm.py
@ -1346,6 +1346,9 @@ class FlashCausalLM(Model):
    def batch_type(self) -> Type[FlashCausalLMBatch]:
        return FlashCausalLMBatch

+    def get_input_embeddings(self, batch):
+        batch.inputs_embeds = None
+
    def init_kv_cache(
        self,
        num_blocks: int,