Remove special, it's not correct enough (and not necessarily useful).

2025-09-11 04:14:52 +00:00 · 2024-01-23 15:04:17 +01:00 · 2024-01-23 15:04:17 +01:00 · 048bc5b4b7
commit 048bc5b4b7
parent c12ff38974
2 changed files with 5 additions and 5 deletions
--- a/router/src/server.rs
+++ b/router/src/server.rs
@ -696,13 +696,13 @@ async fn tokenize(
            .get_ids()
            .iter()
            .zip(encoding.get_offsets())
-            .map(|(&id, (start, stop))| {
+            .map(|(&id, &(start, stop))| {
-                let text: String = input.chars().skip(*start).take(stop - start).collect();
+                let text: String = input.chars().skip(start).take(stop - start).collect();
                SimpleToken {
                    id,
                    text,
-                    start: *start,
+                    start,
-                    stop: *stop,
+                    stop,
                }
            })
            .collect();
--- a/router/src/validation.rs
+++ b/router/src/validation.rs
@ -365,7 +365,7 @@ fn prepare_input(
 ) -> Result<(tokenizers::Encoding, String), ValidationError> {
    // Get the number of tokens in the input
    let mut encoding = tokenizer
-        .encode(inputs.clone(), true)
+        .encode(inputs.clone(), false)
        .map_err(|err| ValidationError::Tokenizer(err.to_string()))?;
    // Optionally truncate