(ffi) use const for GetSamplingConfig

2025-07-12 02:40:16 +00:00 · 2024-08-01 07:49:37 +00:00 · 2024-08-01 07:49:37 +00:00 · 0cd7538a48
commit 0cd7538a48
parent cea64e234f
2 changed files with 21 additions and 20 deletions
--- a/backends/trtllm/include/backend.h
+++ b/backends/trtllm/include/backend.h
@ -48,12 +48,12 @@ namespace huggingface::tgi::backends {
     * @return
     */
    tle::SamplingConfig GetSamplingConfig(
-            uint32_t topK,
+            const uint32_t topK,
-            float_t topP,
+            const float_t topP,
-            float_t temperature,
+            const float_t temperature,
-            float_t repetition_penalty,
+            const float_t repetition_penalty,
-            float_t frequency_penalty,
+            const float_t frequency_penalty,
-            uint64_t seed
+            const uint64_t seed
    );
    /**
@ -94,13 +94,14 @@ namespace huggingface::tgi::backends {
         * @return Request id related to this generation for reference
         */
        [[nodiscard]] RequestId Submit(
-                const std::vector<TokenId> &tokens,
+                const std::vector <TokenId> &tokens,
-                int32_t topK,
+                const uint32_t maxNewTokens,
-                float_t topP,
+                const int32_t topK,
-                float_t temperature,
+                const float_t topP,
-                float_t repetition_penalty,
+                const float_t temperature,
-                float_t frequency_penalty,
+                const float_t repetition_penalty,
-                uint64_t seed
+                const float_t frequency_penalty,
                const uint64_t seed
        );
        /**
@ -108,7 +109,7 @@ namespace huggingface::tgi::backends {
         * @param requestId The request id to poll the generation results
         * @return
         */
-        std::vector<tle::Response> Poll(RequestId requestId);
+        std::vector <tle::Response> Poll(RequestId requestId);
        /**
         * Stop the underlying executor
--- a/backends/trtllm/lib/backend.cpp
+++ b/backends/trtllm/lib/backend.cpp
@ -55,12 +55,12 @@ tle::ExecutorConfig huggingface::tgi::backends::GetExecutorConfig(const json &co
 }
 tle::SamplingConfig huggingface::tgi::backends::GetSamplingConfig(
-        uint32_t topK,
+        const uint32_t topK,
-        float_t topP,
+        const float_t topP,
-        float_t temperature,
+        const float_t temperature,
-        float_t repetition_penalty,
+        const float_t repetition_penalty,
-        float_t frequency_penalty,
+        const float_t frequency_penalty,
-        uint64_t seed) {
+        const uint64_t seed) {
    return tle::SamplingConfig(
            1,  // TGI only use a single beam
            topK,