Support TheBloke exported models.

2025-09-10 20:04:52 +00:00 · 2023-09-25 10:02:49 +00:00 · 2023-09-25 10:02:49 +00:00 · cbf047b4ae
commit cbf047b4ae
parent 2d8c034df3
1 changed files with 12 additions and 1 deletions
--- a/server/text_generation_server/utils/weights.py
+++ b/server/text_generation_server/utils/weights.py
@ -345,4 +345,15 @@ class Weights:
                self.gptq_bits = data["bits"]
                self.gptq_groupsize = data["group_size"]
            except Exception:
-                pass
+                filename = "quant_config.json"
                try:
                    if os.path.exists(os.path.join(model_id, filename)):
                        filename = os.path.join(model_id, filename)
                    else:
                        filename = hf_hub_download(model_id, filename=filename)
                    with open(filename, "r") as f:
                        data = json.load(f)
                    self.gptq_bits = data["w_bit"]
                    self.gptq_groupsize = data["q_group_size"]
                except Exception:
                    pass