改进模型加载以及增加 GPU 选择

2024-11-04 16:27:35 +08:00 · 2024-11-04 16:27:35 +08:00 · 7641757e45
commit 7641757e45
parent 5498c82c6c
5 changed files with 22 additions and 6 deletions
--- a/2
+++ b/2
@ -1,4 +1,4 @@
-# docker build . --platform linux/amd64 --push  -t leafdev.top/ecosystem/zero-shot-classification:v0.0.1
+# docker build . --platform linux/amd64 --push  -t leafdev.top/ecosystem/zero-shot-classification:v0.0.2
 FROM python:3.12.7

 #
--- a/classification.py
+++ b/classification.py
@ -1,10 +1,8 @@
-from pprint import pprint
-
 from pydantic import BaseModel
 from transformers import pipeline
+from config import MODEL_ARGS

-classifier = pipeline("zero-shot-classification",
-                      model="MoritzLaurer/mDeBERTa-v3-base-mnli-xnli")
+classifier = pipeline("zero-shot-classification", **MODEL_ARGS)


 # 返回一个结构化的内容
--- a/config.py
+++ b/config.py
@ -0,0 +1,15 @@
+import os
+from pprint import pprint
+
+MODEL_ARGS = {
+    "model": "MoritzLaurer/mDeBERTa-v3-base-mnli-xnli",
+    "device": int(os.environ.get("GPU_DEVICE", -1))
+}
+
+HTTP_ARGS = {
+    "host": os.environ.get("HOST", "0.0.0.0"),
+    "port": int(os.environ.get("PORT", 8000))
+}
+
+pprint(MODEL_ARGS)
+pprint(HTTP_ARGS)
--- a/main.py
+++ b/main.py
@ -2,6 +2,7 @@ import uvicorn
 from fastapi import FastAPI
 from pydantic import BaseModel
 import classification
+from config import HTTP_ARGS

 app = FastAPI()

@ -24,4 +25,4 @@ def classify(req: TextClassificationRequest) -> TextClassificationResponse:


 if __name__ == "__main__":
-    uvicorn.run(app, host="0.0.0.0", port=8000)
+    uvicorn.run(app, **HTTP_ARGS)
--- a/manifest.yaml
+++ b/manifest.yaml
@ -45,6 +45,8 @@ spec:
              value: "/app/models"
            - name: HF_ENDPOINT
              value: "https://hf-mirror.com"
+            - name: GPU_DEVICE
+              value: "-1"
 #            - name: CUDA_VISIBLE_DEVICES
 #              value: "1"
          ports: