text-generation-inference/router/src/main.rs

use bloom_inference_client::ShardedClient;
use std::net::SocketAddr;
use text_generation_router::server;
use tokenizers::Tokenizer;

fn main() -> Result<(), std::io::Error> {
    let tokenizer = Tokenizer::from_pretrained("bigscience/bloom", None).unwrap();

    tokio::runtime::Builder::new_multi_thread()
        .enable_all()
        .build()
        .unwrap()
        .block_on(async {
            tracing_subscriber::fmt::init();

            let sharded_client = ShardedClient::connect_uds("/tmp/bloom-inference-0".to_string())
                .await
                .expect("Could not connect to server");
            sharded_client
                .clear_cache()
                .await
                .expect("Unable to clear cache");
            tracing::info!("Connected");

            let addr = SocketAddr::from(([0, 0, 0, 0], 3000));

            server::run(sharded_client, tokenizer, addr).await;
            Ok(())
        })
}
Init 2022-10-08 10:30:12 +00:00			`use bloom_inference_client::ShardedClient;`
feat: Docker image 2022-10-14 13:56:21 +00:00			`use std::net::SocketAddr;`
feat: Improve error handling 2022-10-17 12:59:00 +00:00			`use text_generation_router::server;`
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00			`use tokenizers::Tokenizer;`
Init 2022-10-08 10:30:12 +00:00
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00			`fn main() -> Result<(), std::io::Error> {`
			`let tokenizer = Tokenizer::from_pretrained("bigscience/bloom", None).unwrap();`

			`tokio::runtime::Builder::new_multi_thread()`
			`.enable_all()`
			`.build()`
			`.unwrap()`
			`.block_on(async {`
			`tracing_subscriber::fmt::init();`
Init 2022-10-08 10:30:12 +00:00
feat: Improve error handling 2022-10-17 12:59:00 +00:00			`let sharded_client = ShardedClient::connect_uds("/tmp/bloom-inference-0".to_string())`
			`.await`
			`.expect("Could not connect to server");`
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00			`sharded_client`
			`.clear_cache()`
			`.await`
			`.expect("Unable to clear cache");`
			`tracing::info!("Connected");`
Init 2022-10-08 10:30:12 +00:00
feat: Docker image 2022-10-14 13:56:21 +00:00			`let addr = SocketAddr::from(([0, 0, 0, 0], 3000));`
Init 2022-10-08 10:30:12 +00:00
Use axum 2022-10-11 16:14:39 +00:00			`server::run(sharded_client, tokenizer, addr).await;`
			`Ok(())`
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00			`})`
Init 2022-10-08 10:30:12 +00:00			`}`