nix: experimental support for building a Docker image

Run using something like: ``` docker run \ --device nvidia.com/gpu=all \ -it --rm -p 8080:80 \ -v $PWD/data:/data \ -v $PWD/tmp:/tmp \ tgi-docker:latest \ --model-id <model_id> ```
2025-09-17 23:34:52 +00:00 · 2024-08-29 08:16:37 +00:00 · 2024-08-29 08:16:37 +00:00 · 77a36d45eb
commit 77a36d45eb
parent 5b6b74e21d
1 changed files with 25 additions and 9 deletions
--- a/flake.nix
+++ b/flake.nix
@ -141,15 +141,31 @@
          };
        };

-        packages.default = pkgs.writeShellApplication {
-          name = "text-generation-inference";
-          runtimeInputs = [
-            server
-            router
-          ];
-          text = ''
-            ${launcher}/bin/text-generation-launcher "$@"
-          '';
+        packages = rec {
+          default = pkgs.writeShellApplication {
+            name = "text-generation-inference";
+            runtimeInputs = [
+              server
+              router
+            ];
+            text = ''
+              ${launcher}/bin/text-generation-launcher "$@"
+            '';
+          };
+
+          dockerImage = pkgs.dockerTools.buildLayeredImage {
+            name = "tgi-docker";
+            tag = "latest";
+            config = {
+              EntryPoint = [ "${default}/bin/text-generation-inference" ];
+              Env = [
+                "HF_HOME=/data"
+                "PORT=80"
+              ];
+
+            };
+            contents = [ pkgs.cacert ];
+          };
        };
      }
    );