chore: rebase and fix formatting

2025-09-11 20:34:54 +00:00 · 2024-04-30 09:46:27 +02:00 · 2024-04-30 09:46:27 +02:00 · 21ec5393ac
commit 21ec5393ac
parent fcbd7fcd2e
2 changed files with 5 additions and 2 deletions
--- a/.gitignore
+++ b/.gitignore
@ -11,3 +11,5 @@ server/exllama_kernels/exllama_kernels/hip_func/
 *_hip.cuh
 server/exllama_kernels/exllama_kernels/hip_buffers.cuh
 server/exllama_kernels/exllama_kernels/exllama_ext_hip.cpp
+
+data/
--- a/server/text_generation_server/utils/logits_process.py
+++ b/server/text_generation_server/utils/logits_process.py
@ -146,7 +146,6 @@ class FrequencyPenaltyLogitsProcessor(LogitsProcessor):
        # set score to 0 where input_ids is a padding token
        score *= input_ids.ne(0)

-
        return scores.scatter_add_(1, input_ids, score)


@ -172,7 +171,9 @@ class HeterogeneousFrequencyPenaltyLogitsProcessor(LogitsProcessor):

        # Calculate the frequency for each token so far
        token_freq = torch.zeros(batch_size, vocab_size, device=input_ids.device)
-        token_freq.scatter_add_(1, input_ids, torch.ones_like(input_ids, dtype=torch.float))
+        token_freq.scatter_add_(
+            1, input_ids, torch.ones_like(input_ids, dtype=torch.float)
+        )
        token_freq /= input_size

        # Apply the frequency penalty to logits