fix: prefer env value from clap for better defaults

2025-09-11 04:14:52 +00:00 · 2024-01-18 11:03:05 -05:00 · 2024-01-18 11:03:05 -05:00 · 215afc15f0
commit 215afc15f0
parent 90541fba07
2 changed files with 6 additions and 1 deletions
--- a/router/src/main.rs
+++ b/router/src/main.rs
@ -71,6 +71,8 @@ struct Args {
    ngrok_authtoken: Option<String>,
    #[clap(long, env)]
    ngrok_edge: Option<String>,
+    #[clap(long, env, default_value_t = false)]
+    chat_enabled_api: bool,
 }

 #[tokio::main]
@ -102,6 +104,7 @@ async fn main() -> Result<(), RouterError> {
        ngrok,
        ngrok_authtoken,
        ngrok_edge,
+        chat_enabled_api,
    } = args;

    // Launch Tokio runtime
@ -345,6 +348,7 @@ async fn main() -> Result<(), RouterError> {
        ngrok_authtoken,
        ngrok_edge,
        tokenizer_config,
+        chat_enabled_api,
    )
    .await?;
    Ok(())
--- a/router/src/server.rs
+++ b/router/src/server.rs
@ -708,6 +708,7 @@ pub async fn run(
    ngrok_authtoken: Option<String>,
    ngrok_edge: Option<String>,
    tokenizer_config: HubTokenizerConfig,
+    chat_enabled_api: bool,
 ) -> Result<(), axum::BoxError> {
    // OpenAPI documentation
    #[derive(OpenApi)]
@ -871,7 +872,7 @@ pub async fn run(
        .route("/metrics", get(metrics));

    // Conditional AWS Sagemaker route
-    let aws_sagemaker_route = if std::env::var("OAI_ENABLED").map_or(false, |val| val == "true") {
+    let aws_sagemaker_route = if chat_enabled_api {
        Router::new().route("/invocations", post(chat_completions)) // Use 'chat_completions' for OAI_ENABLED
    } else {
        Router::new().route("/invocations", post(compat_generate)) // Use 'compat_generate' otherwise