text-generation-inference/router/src/main.rs

use bloom_inference_client::ShardedClient;
use poem::listener::TcpListener;
use std::time::Duration;
use tokenizers::Tokenizer;

mod server;
mod validation;

use validation::Validation;

mod db;

use db::Db;

mod batcher;

use batcher::Batcher;

fn main() -> Result<(), std::io::Error> {
    let tokenizer = Tokenizer::from_pretrained("bigscience/bloom", None).unwrap();

    tokio::runtime::Builder::new_multi_thread()
        .enable_all()
        .build()
        .unwrap()
        .block_on(async {
            tracing_subscriber::fmt::init();

            let sharded_client = ShardedClient::connect_uds(
                "/tmp/bloom-inference-0".to_string(),
                Duration::from_secs(5),
            )
            .await;
            sharded_client
                .clear_cache()
                .await
                .expect("Unable to clear cache");
            tracing::info!("Connected");

            let addr = "127.0.0.1:3000".to_string();
            let listener = TcpListener::bind(addr);

            server::run(sharded_client, tokenizer, listener).await
        })
}
Init 2022-10-08 10:30:12 +00:00			`use bloom_inference_client::ShardedClient;`
Add load testing 2022-10-11 08:36:51 +00:00			`use poem::listener::TcpListener;`
Init 2022-10-08 10:30:12 +00:00			`use std::time::Duration;`
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00			`use tokenizers::Tokenizer;`
Init 2022-10-08 10:30:12 +00:00
Add load testing 2022-10-11 08:36:51 +00:00			`mod server;`
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00			`mod validation;`

			`use validation::Validation;`
Init 2022-10-08 10:30:12 +00:00
Add load testing 2022-10-11 08:36:51 +00:00			`mod db;`
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00
Init 2022-10-08 10:30:12 +00:00			`use db::Db;`

Add load testing 2022-10-11 08:36:51 +00:00			`mod batcher;`
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00
Add load testing 2022-10-11 08:36:51 +00:00			`use batcher::Batcher;`
Init 2022-10-08 10:30:12 +00:00
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00			`fn main() -> Result<(), std::io::Error> {`
			`let tokenizer = Tokenizer::from_pretrained("bigscience/bloom", None).unwrap();`

			`tokio::runtime::Builder::new_multi_thread()`
			`.enable_all()`
			`.build()`
			`.unwrap()`
			`.block_on(async {`
			`tracing_subscriber::fmt::init();`
Init 2022-10-08 10:30:12 +00:00
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00			`let sharded_client = ShardedClient::connect_uds(`
			`"/tmp/bloom-inference-0".to_string(),`
			`Duration::from_secs(5),`
			`)`
Init 2022-10-08 10:30:12 +00:00			`.await;`
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00			`sharded_client`
			`.clear_cache()`
			`.await`
			`.expect("Unable to clear cache");`
			`tracing::info!("Connected");`
Init 2022-10-08 10:30:12 +00:00
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00			`let addr = "127.0.0.1:3000".to_string();`
			`let listener = TcpListener::bind(addr);`
Init 2022-10-08 10:30:12 +00:00
Refactored gRPC interface Added validation logic 2022-10-11 14:50:54 +00:00			`server::run(sharded_client, tokenizer, listener).await`
			`})`
Init 2022-10-08 10:30:12 +00:00			`}`