add transformers gptq support

2025-09-10 20:04:52 +00:00 · 2023-08-31 15:30:02 +02:00 · 2023-08-31 15:30:02 +02:00 · 1a800db0a8
commit 1a800db0a8
parent 7c2e0af2a6
1 changed files with 15 additions and 4 deletions
--- a/server/text_generation_server/utils/weights.py
+++ b/server/text_generation_server/utils/weights.py
@ -222,7 +222,7 @@ class Weights:
        return bits, groupsize

    def _set_gptq_params(self, model_id):
-        filename = "quantize_config.json"
+        filename = "config.json"
        try:
            if os.path.exists(os.path.join(model_id, filename)):
                filename = os.path.join(model_id, filename)
@ -230,7 +230,18 @@ class Weights:
                filename = hf_hub_download(model_id, filename=filename)
            with open(filename, "r") as f:
                data = json.load(f)
-            self.gptq_bits = data["bits"]
-            self.gptq_groupsize = data["group_size"]
+            self.gptq_bits = data["quantization_config"]["bits"]
+            self.gptq_groupsize = data["quantization_config"]["group_size"]
        except Exception:
-            pass
+            filename = "quantize_config.json"
+            try:
+                if os.path.exists(os.path.join(model_id, filename)):
+                    filename = os.path.join(model_id, filename)
+                else:
+                    filename = hf_hub_download(model_id, filename=filename)
+                with open(filename, "r") as f:
+                    data = json.load(f)
+                self.gptq_bits = data["bits"]
+                self.gptq_groupsize = data["group_size"]
+            except Exception:
+                pass