add docker load_tests

2025-09-12 12:54:52 +00:00 · 2024-08-09 13:16:49 +02:00 · 2024-08-09 13:16:49 +02:00 · cd1e2cd2cf
commit cd1e2cd2cf
parent 7830de1566
2 changed files with 17 additions and 2 deletions
--- a/load_tests/common.js
+++ b/load_tests/common.js
@ -36,7 +36,7 @@ export function get_options() {
            load_test: {
                executor: 'constant-arrival-rate',
                duration: '60s',
-                preAllocatedVUs: 100,
+                preAllocatedVUs: 50, // not enough RAM for 100 VUs
                rate: 1,
                timeUnit: '1s',
            },
@ -68,13 +68,16 @@ export default function run() {
    const headers = { 'Content-Type': 'application/json' };
    const query = shareGPT[scenario.iterationInTest % shareGPT.length];
    const payload = JSON.stringify(generate_payload(query, max_new_tokens));
-    const res = http.post(`http://${host}/v1/chat/completions`, payload, {
+    const res = http.post(`https://${host}/v1/chat/completions`, payload, {
        headers,
    });
    if (res.status >= 400 && res.status < 500) {
        return;
    }

+    if (res.status !== 200) {
+        console.error(res.body);
+    }

    check(res, {
        'Post status is 200': (res) => res.status === 200,
--- a/load_tests/docker-compose.yml
+++ b/load_tests/docker-compose.yml
@ -0,0 +1,12 @@
+services:
+
+  # How to run:
+  # HOST=..... docker compose up
+  tgi_load_test:
+    image: grafana/k6
+    command: run /load_tests/common.js
+    environment:
+      - HOST=${HOST}
+      - MODEL_ID=${MODEL_ID}
+    volumes:
+      - ./:/load_tests:Z