text-generation-inference

mirror of https://github.com/huggingface/text-generation-inference.git synced 2025-06-14 13:22:07 +00:00

History

Dhruv Srikanth b1d370e062 Update torch import reference in bnb quantization (#1902 ) # What does this PR do? Fixes `Import Error` occurring from mismatch of usage between torch.nn.Module and nn.Module.		2024-07-17 05:36:58 +00:00
..
awq	Refactor layers. (#1866 )	2024-07-17 05:36:58 +00:00
gptq	Refactor layers. (#1866 )	2024-07-17 05:36:58 +00:00
__init__.py	MLPSpeculator. (#1865 )	2024-07-17 05:36:58 +00:00
bnb.py	Update torch import reference in bnb quantization (#1902 )	2024-07-17 05:36:58 +00:00
conv.py	Refactor layers. (#1866 )	2024-07-17 05:36:58 +00:00
eetq.py	Refactor layers. (#1866 )	2024-07-17 05:36:58 +00:00
fp8.py	Refactor layers. (#1866 )	2024-07-17 05:36:58 +00:00
layernorm.py	Refactor layers. (#1866 )	2024-07-17 05:36:58 +00:00
linear.py	Refactor layers. (#1866 )	2024-07-17 05:36:58 +00:00
medusa.py	MLPSpeculator. (#1865 )	2024-07-17 05:36:58 +00:00
mlp.py	MLPSpeculator. (#1865 )	2024-07-17 05:36:58 +00:00
rotary.py	Refactor layers. (#1866 )	2024-07-17 05:36:58 +00:00
speculative.py	MLPSpeculator. (#1865 )	2024-07-17 05:36:58 +00:00
tensor_parallel.py	Refactor layers. (#1866 )	2024-07-17 05:36:58 +00:00