text-generation-inference

mirror of https://github.com/huggingface/text-generation-inference.git synced 2025-04-22 15:32:08 +00:00

History

Ubuntu fb0840944c Reducing number of reps while autotuning.		2023-06-06 11:56:10 +00:00
..
__init__.py	[WIP] Adding GPTQ support for llama	2023-05-11 12:05:35 +00:00
custom_autotune.py	Reducing number of reps while autotuning.	2023-06-06 11:56:10 +00:00
fused_attn.py	[WIP] Adding GPTQ support for llama	2023-05-11 12:05:35 +00:00
fused_mlp.py	[WIP] Adding GPTQ support for llama	2023-05-11 12:05:35 +00:00
quant_linear.py	Working version.	2023-05-11 12:05:35 +00:00
quantizer.py	[WIP] Adding GPTQ support for llama	2023-05-11 12:05:35 +00:00