Update server/text_generation_server/models/custom_modeling/flash_santacoder_modeling.py

2025-09-10 20:04:52 +00:00 · 2023-07-12 08:38:17 +02:00 · 2023-07-12 08:38:17 +02:00 · f5e8f73a1c
commit f5e8f73a1c
parent 1b7b91a4d3
1 changed files with 2 additions and 2 deletions
--- a/server/text_generation_server/models/custom_modeling/flash_santacoder_modeling.py
+++ b/server/text_generation_server/models/custom_modeling/flash_santacoder_modeling.py
@ -81,8 +81,8 @@ def _load_multi_mqa_gptq(
            try:
                import os
-                bits = int(os.getenv("GTPQ_BITS"))
+                bits = int(os.getenv("GPTQ_BITS"))
-                groupsize = int(os.getenv("GTPQ_GROUPSIZE"))
+                groupsize = int(os.getenv("GPTQ_GROUPSIZE"))
            except Exception:
                raise e