Change default values

Signed-off-by: yuanwu <yuan.wu@intel.com>
2025-09-09 19:34:53 +00:00 · 2025-03-21 05:50:08 +00:00 · 2025-03-21 05:50:08 +00:00 · c6f97fd884
commit c6f97fd884
parent 3c6630c6e9
1 changed files with 4 additions and 4 deletions
--- a/backends/gaudi/server/text_generation_server/models/custom_modeling/llava_next.py
+++ b/backends/gaudi/server/text_generation_server/models/custom_modeling/llava_next.py
@ -110,8 +110,8 @@ class LlavaNextForConditionalGeneration(GaudiLlavaNextForConditionalGeneration):
        output_hidden_states: Optional[bool] = None,
        return_dict: Optional[bool] = None,
        token_idx: Optional[torch.Tensor] = None,
-        use_flash_attention: Optional[bool] = False,
+        use_flash_attention: Optional[bool] = True,
-        flash_attention_recompute: Optional[bool] = False,
+        flash_attention_recompute: Optional[bool] = True,
    ):
        if token_idx is not None:
@ -337,8 +337,8 @@ class LlavaNextForConditionalGeneration(GaudiLlavaNextForConditionalGeneration):
                **kwargs,
            )
        else:
-            use_flash_attention = kwargs.get("use_flash_attention", False)
+            use_flash_attention = kwargs.get("use_flash_attention", True)
-            flash_attention_recompute = kwargs.get("flash_attention_recompute", False)
+            flash_attention_recompute = kwargs.get("flash_attention_recompute", True)
            position_ids = kwargs.get("position_ids", None)
            labels = kwargs.get("labels", None)