text-generation-inference

mirror of https://github.com/huggingface/text-generation-inference.git synced 2025-10-09 06:55:24 +00:00

History

Nicolas Patry 1b434e8019 Refactor dead code - Removing all `flash_xxx.py` files. (#2166 ) * Refactor dead code. * First working step. * Remove a lot of duplicated code. * More dead code. * More cleanup. * Fix Santacoder test. * Fixing the simple tests. * Fixing sharding. * Fixes for VLM. * Fixing santacoder (num_kv_heads hardcoded). * Removing more dead code. * Fixing `config.n_head`. * Stopping earlier because of `<end_of_utterance>` in idefics2. * Addresses comments. * Removing the dead code. * Fuse back mistral into FlashCausalLM. * Finish removal. * Fixing docs + causal_lm `batch_class`. * Fixing docs + causal.lm. * Add default to Gemma Causality. * Default value for gemma/gemma2. * Wrong default.		2024-09-25 05:20:28 +00:00
..
custom_modeling	Refactor dead code - Removing all `flash_xxx.py` files. (#2166 )	2024-09-25 05:20:28 +00:00
__init__.py	Refactor dead code - Removing all `flash_xxx.py` files. (#2166 )	2024-09-25 05:20:28 +00:00
bloom.py	Refactor dead code - Removing all `flash_xxx.py` files. (#2166 )	2024-09-25 05:20:28 +00:00
causal_lm.py	Refactor dead code - Removing all `flash_xxx.py` files. (#2166 )	2024-09-25 05:20:28 +00:00
flash_causal_lm.py	Refactor dead code - Removing all `flash_xxx.py` files. (#2166 )	2024-09-25 05:20:28 +00:00
flash_mistral.py	Refactor dead code - Removing all `flash_xxx.py` files. (#2166 )	2024-09-25 05:20:28 +00:00
galactica.py	Refactor dead code - Removing all `flash_xxx.py` files. (#2166 )	2024-09-25 05:20:28 +00:00
globals.py	Move to FlashDecoding instead of PagedAttention kernel. (#1940 )	2024-09-24 03:58:13 +00:00
idefics_causal_lm.py	Enable multiple LoRa adapters (#2010 )	2024-09-24 03:55:04 +00:00
idefics.py	Enable multiple LoRa adapters (#2010 )	2024-09-24 03:55:04 +00:00
mamba.py	Enable multiple LoRa adapters (#2010 )	2024-09-24 03:55:04 +00:00
model.py	Enable multiple LoRa adapters (#2010 )	2024-09-24 03:55:04 +00:00
pali_gemma.py	Refactor dead code - Removing all `flash_xxx.py` files. (#2166 )	2024-09-25 05:20:28 +00:00
seq2seq_lm.py	Refactor dead code - Removing all `flash_xxx.py` files. (#2166 )	2024-09-25 05:20:28 +00:00
types.py	chore: add pre-commit (#1569 )	2024-04-24 15:32:02 +03:00
vlm_causal_lm.py	Refactor dead code - Removing all `flash_xxx.py` files. (#2166 )	2024-09-25 05:20:28 +00:00