fix: remove compilation artifacts from logit processor

2025-07-15 20:30:16 +00:00 · 2024-03-08 03:44:38 +00:00 · 2024-03-08 03:44:38 +00:00 · d031919c8a
commit d031919c8a
parent 1f7be736d2
1 changed files with 0 additions and 15 deletions
--- a/server/text_generation_server/utils/logits_process.py
+++ b/server/text_generation_server/utils/logits_process.py
@ -3,10 +3,8 @@ import torch

 from loguru import logger
 from typing import Dict, Union
-from text_generation_server.pb.generate_pb2 import GrammarType

 from outlines.fsm.fsm import RegexFSM
-from outlines.fsm.json_schema import build_regex_from_schema
 from functools import lru_cache
 from typing import List, Optional, DefaultDict
 import time
@ -520,19 +518,6 @@ class GrammarLogitProcessor(LogitsProcessor):
            return fsm_grammar_state
        return fsm.next_state(fsm_grammar_state, next_token_id)

-    # TODO: move grammar compilation into the router
-    @staticmethod
-    @lru_cache(maxsize=32, typed=True)
-    def _cached_compile_fsm(grammar_type, schema, tokenizer):
-        start_time = time.time()
-        if grammar_type == GrammarType.GRAMMAR_TYPE_JSON:
-            schema = build_regex_from_schema(schema)
-        elif grammar_type == GrammarType.GRAMMAR_TYPE_REGEX:
-            pass  # schema is already a regex just here for clarity
-        fsm = RegexFSM(schema, tokenizer)
-        logger.debug(f"Compiled FSM in {time.time() - start_time:.2f}s")
-        return fsm
-
    @staticmethod
    @lru_cache(maxsize=32, typed=True)
    def _cached_adapt_tokenizer(tokenizer):