Update server/text_generation_server/models/custom_modeling/flash_mistral_modeling.py

2025-09-11 04:14:52 +00:00 · 2023-11-08 19:07:58 +09:00 · 2023-11-08 19:07:58 +09:00 · 0eea83be44
commit 0eea83be44
parent 891fe74099
1 changed files with 1 additions and 1 deletions
--- a/server/text_generation_server/models/custom_modeling/flash_mistral_modeling.py
+++ b/server/text_generation_server/models/custom_modeling/flash_mistral_modeling.py
@ -43,7 +43,7 @@ if IS_CUDA_SYSTEM:
 elif IS_ROCM_SYSTEM:
    from vllm import layernorm_ops

-if not HAS_FLASH_ATTN_V2_ROCM and not HAS_FLASH_ATTN_V2_ROCM:
+if not HAS_FLASH_ATTN_V2_CUDA and not HAS_FLASH_ATTN_V2_ROCM:
    raise ImportError("Mistral model requires flash attn v2")