text-generation-inference/__init__.py at 57a6cbff82126e2197e6e73bf210d0c303dff043 - text-generation-inference - Leaflow Developers

huggingface/text-generation-inference

mirror of https://github.com/huggingface/text-generation-inference.git synced 2025-04-23 16:02:10 +00:00

Ubuntu 2c9e1171bc [WIP] Adding GPTQ support for llama

2023-05-11 12:05:35 +00:00

5 lines

255 B

Python

Raw Blame History

 from .quantizer import Quantizer
 from .fused_attn import QuantLlamaAttention, make_quant_attn
 from .fused_mlp import QuantLlamaMLP, make_fused_mlp, autotune_warmup_fused
 from .quant_linear import QuantLinear, make_quant_linear, autotune_warmup_linear