mirror of
https://github.com/huggingface/text-generation-inference.git
synced 2025-09-11 12:24:53 +00:00
Fixing a few tests.
This commit is contained in:
parent
3ed703c273
commit
a78b6fd1e8
@ -467,6 +467,16 @@ Options:
|
|||||||
[env: PAYLOAD_LIMIT=]
|
[env: PAYLOAD_LIMIT=]
|
||||||
[default: 2000000]
|
[default: 2000000]
|
||||||
|
|
||||||
|
```
|
||||||
|
## ENABLE_PREFILL_LOGPROBS
|
||||||
|
```shell
|
||||||
|
--enable-prefill-logprobs
|
||||||
|
Enables prefill logprobs
|
||||||
|
|
||||||
|
Logprobs in the prompt are deactivated by default because they consume a large amount of VRAM (especially for long prompts). Using this flag reallows users to ask for them.
|
||||||
|
|
||||||
|
[env: ENABLE_PREFILL_LOGPROBS=]
|
||||||
|
|
||||||
```
|
```
|
||||||
## HELP
|
## HELP
|
||||||
```shell
|
```shell
|
||||||
|
22
integration-tests/models/__snapshots__/test.py
Normal file
22
integration-tests/models/__snapshots__/test.py
Normal file
@ -0,0 +1,22 @@
|
|||||||
|
import os
|
||||||
|
import json
|
||||||
|
|
||||||
|
|
||||||
|
for root, dirs, files in os.walk("."):
|
||||||
|
for filename in files:
|
||||||
|
if filename.endswith(".json"):
|
||||||
|
with open(os.path.join(root, filename), "r") as f:
|
||||||
|
data = json.load(f)
|
||||||
|
|
||||||
|
print(os.path.join(root, filename))
|
||||||
|
try:
|
||||||
|
if filename.endswith("_load.json"):
|
||||||
|
for i in range(len(data)):
|
||||||
|
data[i]["details"]["prefill"] = []
|
||||||
|
else:
|
||||||
|
data["details"]["prefill"] = []
|
||||||
|
except Exception:
|
||||||
|
pass
|
||||||
|
|
||||||
|
with open(os.path.join(root, filename), "w") as f:
|
||||||
|
json.dump(data, f, indent=2, ensure_ascii=False)
|
@ -3,7 +3,63 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 17934,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "Pour"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 49833,
|
||||||
|
"logprob": -10.5703125,
|
||||||
|
"text": " dég"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 21543,
|
||||||
|
"logprob": -0.14746094,
|
||||||
|
"text": "uster"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 447,
|
||||||
|
"logprob": -1.9277344,
|
||||||
|
"text": " un"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 46341,
|
||||||
|
"logprob": -15.421875,
|
||||||
|
"text": " ort"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 35567,
|
||||||
|
"logprob": -7.5820312,
|
||||||
|
"text": "olan"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 15,
|
||||||
|
"logprob": -1.4013672,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1669,
|
||||||
|
"logprob": -1.5595703,
|
||||||
|
"text": " il"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 11580,
|
||||||
|
"logprob": -0.9428711,
|
||||||
|
"text": " faut"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3913,
|
||||||
|
"logprob": -3.703125,
|
||||||
|
"text": " tout"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 39261,
|
||||||
|
"logprob": -1.7763672,
|
||||||
|
"text": " d'abord"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": 0,
|
"seed": 0,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -3,7 +3,33 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 15,
|
||||||
|
"logprob": null,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1669,
|
||||||
|
"logprob": -5.4453125,
|
||||||
|
"text": " il"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 11580,
|
||||||
|
"logprob": -2.3378906,
|
||||||
|
"text": " faut"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3913,
|
||||||
|
"logprob": -4.3320312,
|
||||||
|
"text": " tout"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 39261,
|
||||||
|
"logprob": -2.9160156,
|
||||||
|
"text": " d'abord"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": 0,
|
"seed": 0,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -4,7 +4,63 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 17934,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "Pour"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 49833,
|
||||||
|
"logprob": -10.5625,
|
||||||
|
"text": " dég"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 21543,
|
||||||
|
"logprob": -0.14770508,
|
||||||
|
"text": "uster"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 447,
|
||||||
|
"logprob": -1.9287109,
|
||||||
|
"text": " un"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 46341,
|
||||||
|
"logprob": -15.4609375,
|
||||||
|
"text": " ort"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 35567,
|
||||||
|
"logprob": -7.5585938,
|
||||||
|
"text": "olan"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 15,
|
||||||
|
"logprob": -1.4003906,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1669,
|
||||||
|
"logprob": -1.5673828,
|
||||||
|
"text": " il"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 11580,
|
||||||
|
"logprob": -0.94628906,
|
||||||
|
"text": " faut"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3913,
|
||||||
|
"logprob": -3.703125,
|
||||||
|
"text": " tout"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 39261,
|
||||||
|
"logprob": -1.5732422,
|
||||||
|
"text": " d'abord"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -76,7 +132,63 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 17934,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "Pour"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 49833,
|
||||||
|
"logprob": -10.53125,
|
||||||
|
"text": " dég"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 21543,
|
||||||
|
"logprob": -0.14770508,
|
||||||
|
"text": "uster"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 447,
|
||||||
|
"logprob": -1.9287109,
|
||||||
|
"text": " un"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 46341,
|
||||||
|
"logprob": -15.4140625,
|
||||||
|
"text": " ort"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 35567,
|
||||||
|
"logprob": -7.5234375,
|
||||||
|
"text": "olan"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 15,
|
||||||
|
"logprob": -1.3613281,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1669,
|
||||||
|
"logprob": -1.5458984,
|
||||||
|
"text": " il"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 11580,
|
||||||
|
"logprob": -0.94189453,
|
||||||
|
"text": " faut"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3913,
|
||||||
|
"logprob": -3.7011719,
|
||||||
|
"text": " tout"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 39261,
|
||||||
|
"logprob": -1.5732422,
|
||||||
|
"text": " d'abord"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -148,7 +260,63 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 17934,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "Pour"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 49833,
|
||||||
|
"logprob": -10.53125,
|
||||||
|
"text": " dég"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 21543,
|
||||||
|
"logprob": -0.14770508,
|
||||||
|
"text": "uster"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 447,
|
||||||
|
"logprob": -1.9287109,
|
||||||
|
"text": " un"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 46341,
|
||||||
|
"logprob": -15.4140625,
|
||||||
|
"text": " ort"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 35567,
|
||||||
|
"logprob": -7.5234375,
|
||||||
|
"text": "olan"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 15,
|
||||||
|
"logprob": -1.3613281,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1669,
|
||||||
|
"logprob": -1.5458984,
|
||||||
|
"text": " il"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 11580,
|
||||||
|
"logprob": -0.94189453,
|
||||||
|
"text": " faut"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3913,
|
||||||
|
"logprob": -3.7011719,
|
||||||
|
"text": " tout"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 39261,
|
||||||
|
"logprob": -1.5732422,
|
||||||
|
"text": " d'abord"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -220,7 +388,63 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 17934,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "Pour"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 49833,
|
||||||
|
"logprob": -10.53125,
|
||||||
|
"text": " dég"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 21543,
|
||||||
|
"logprob": -0.14770508,
|
||||||
|
"text": "uster"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 447,
|
||||||
|
"logprob": -1.9287109,
|
||||||
|
"text": " un"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 46341,
|
||||||
|
"logprob": -15.4140625,
|
||||||
|
"text": " ort"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 35567,
|
||||||
|
"logprob": -7.5234375,
|
||||||
|
"text": "olan"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 15,
|
||||||
|
"logprob": -1.3613281,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1669,
|
||||||
|
"logprob": -1.5458984,
|
||||||
|
"text": " il"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 11580,
|
||||||
|
"logprob": -0.94189453,
|
||||||
|
"text": " faut"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3913,
|
||||||
|
"logprob": -3.7011719,
|
||||||
|
"text": " tout"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 39261,
|
||||||
|
"logprob": -1.5732422,
|
||||||
|
"text": " d'abord"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -3,7 +3,63 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 17934,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "Pour"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 49833,
|
||||||
|
"logprob": -10.546875,
|
||||||
|
"text": " dég"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 21543,
|
||||||
|
"logprob": -0.14819336,
|
||||||
|
"text": "uster"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 447,
|
||||||
|
"logprob": -1.9257812,
|
||||||
|
"text": " un"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 46341,
|
||||||
|
"logprob": -15.4296875,
|
||||||
|
"text": " ort"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 35567,
|
||||||
|
"logprob": -7.5625,
|
||||||
|
"text": "olan"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 15,
|
||||||
|
"logprob": -1.4199219,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1669,
|
||||||
|
"logprob": -1.5634766,
|
||||||
|
"text": " il"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 11580,
|
||||||
|
"logprob": -0.9458008,
|
||||||
|
"text": " faut"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3913,
|
||||||
|
"logprob": -3.6816406,
|
||||||
|
"text": " tout"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 39261,
|
||||||
|
"logprob": -1.7753906,
|
||||||
|
"text": " d'abord"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": 0,
|
"seed": 0,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -4,7 +4,63 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 17934,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "Pour"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 49833,
|
||||||
|
"logprob": -10.5390625,
|
||||||
|
"text": " dég"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 21543,
|
||||||
|
"logprob": -0.14758301,
|
||||||
|
"text": "uster"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 447,
|
||||||
|
"logprob": -1.9296875,
|
||||||
|
"text": " un"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 46341,
|
||||||
|
"logprob": -15.4453125,
|
||||||
|
"text": " ort"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 35567,
|
||||||
|
"logprob": -7.59375,
|
||||||
|
"text": "olan"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 15,
|
||||||
|
"logprob": -1.3994141,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1669,
|
||||||
|
"logprob": -1.578125,
|
||||||
|
"text": " il"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 11580,
|
||||||
|
"logprob": -0.9453125,
|
||||||
|
"text": " faut"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3913,
|
||||||
|
"logprob": -3.7011719,
|
||||||
|
"text": " tout"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 39261,
|
||||||
|
"logprob": -1.5732422,
|
||||||
|
"text": " d'abord"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -76,7 +132,63 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 17934,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "Pour"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 49833,
|
||||||
|
"logprob": -10.515625,
|
||||||
|
"text": " dég"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 21543,
|
||||||
|
"logprob": -0.1484375,
|
||||||
|
"text": "uster"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 447,
|
||||||
|
"logprob": -1.9287109,
|
||||||
|
"text": " un"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 46341,
|
||||||
|
"logprob": -15.34375,
|
||||||
|
"text": " ort"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 35567,
|
||||||
|
"logprob": -7.515625,
|
||||||
|
"text": "olan"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 15,
|
||||||
|
"logprob": -1.4199219,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1669,
|
||||||
|
"logprob": -1.5664062,
|
||||||
|
"text": " il"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 11580,
|
||||||
|
"logprob": -0.94091797,
|
||||||
|
"text": " faut"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3913,
|
||||||
|
"logprob": -3.6660156,
|
||||||
|
"text": " tout"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 39261,
|
||||||
|
"logprob": -1.7753906,
|
||||||
|
"text": " d'abord"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -148,7 +260,63 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 17934,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "Pour"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 49833,
|
||||||
|
"logprob": -10.515625,
|
||||||
|
"text": " dég"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 21543,
|
||||||
|
"logprob": -0.1484375,
|
||||||
|
"text": "uster"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 447,
|
||||||
|
"logprob": -1.9287109,
|
||||||
|
"text": " un"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 46341,
|
||||||
|
"logprob": -15.34375,
|
||||||
|
"text": " ort"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 35567,
|
||||||
|
"logprob": -7.515625,
|
||||||
|
"text": "olan"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 15,
|
||||||
|
"logprob": -1.4199219,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1669,
|
||||||
|
"logprob": -1.5664062,
|
||||||
|
"text": " il"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 11580,
|
||||||
|
"logprob": -0.94091797,
|
||||||
|
"text": " faut"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3913,
|
||||||
|
"logprob": -3.6660156,
|
||||||
|
"text": " tout"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 39261,
|
||||||
|
"logprob": -1.7753906,
|
||||||
|
"text": " d'abord"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -220,7 +388,63 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 17934,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "Pour"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 49833,
|
||||||
|
"logprob": -10.515625,
|
||||||
|
"text": " dég"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 21543,
|
||||||
|
"logprob": -0.1484375,
|
||||||
|
"text": "uster"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 447,
|
||||||
|
"logprob": -1.9287109,
|
||||||
|
"text": " un"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 46341,
|
||||||
|
"logprob": -15.34375,
|
||||||
|
"text": " ort"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 35567,
|
||||||
|
"logprob": -7.515625,
|
||||||
|
"text": "olan"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 15,
|
||||||
|
"logprob": -1.4199219,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1669,
|
||||||
|
"logprob": -1.5664062,
|
||||||
|
"text": " il"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 11580,
|
||||||
|
"logprob": -0.94091797,
|
||||||
|
"text": " faut"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3913,
|
||||||
|
"logprob": -3.6660156,
|
||||||
|
"text": " tout"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 39261,
|
||||||
|
"logprob": -1.7753906,
|
||||||
|
"text": " d'abord"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -4,38 +4,7 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [
|
"prefill": [],
|
||||||
{
|
|
||||||
"id": 1,
|
|
||||||
"logprob": null,
|
|
||||||
"text": "<s>"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 1724,
|
|
||||||
"logprob": -7.6914062,
|
|
||||||
"text": "What"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 338,
|
|
||||||
"logprob": -1.4746094,
|
|
||||||
"text": "is"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 21784,
|
|
||||||
"logprob": -9.390625,
|
|
||||||
"text": "Deep"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 29257,
|
|
||||||
"logprob": -1.8623047,
|
|
||||||
"text": "Learning"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 29973,
|
|
||||||
"logprob": -0.7558594,
|
|
||||||
"text": "?"
|
|
||||||
}
|
|
||||||
],
|
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -108,38 +77,7 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [
|
"prefill": [],
|
||||||
{
|
|
||||||
"id": 1,
|
|
||||||
"logprob": null,
|
|
||||||
"text": "<s>"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 1724,
|
|
||||||
"logprob": -7.6914062,
|
|
||||||
"text": "What"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 338,
|
|
||||||
"logprob": -1.4746094,
|
|
||||||
"text": "is"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 21784,
|
|
||||||
"logprob": -9.390625,
|
|
||||||
"text": "Deep"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 29257,
|
|
||||||
"logprob": -1.8623047,
|
|
||||||
"text": "Learning"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 29973,
|
|
||||||
"logprob": -0.7558594,
|
|
||||||
"text": "?"
|
|
||||||
}
|
|
||||||
],
|
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -212,38 +150,7 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [
|
"prefill": [],
|
||||||
{
|
|
||||||
"id": 1,
|
|
||||||
"logprob": null,
|
|
||||||
"text": "<s>"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 1724,
|
|
||||||
"logprob": -7.6914062,
|
|
||||||
"text": "What"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 338,
|
|
||||||
"logprob": -1.4746094,
|
|
||||||
"text": "is"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 21784,
|
|
||||||
"logprob": -9.390625,
|
|
||||||
"text": "Deep"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 29257,
|
|
||||||
"logprob": -1.8623047,
|
|
||||||
"text": "Learning"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 29973,
|
|
||||||
"logprob": -0.7558594,
|
|
||||||
"text": "?"
|
|
||||||
}
|
|
||||||
],
|
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -316,38 +223,7 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [
|
"prefill": [],
|
||||||
{
|
|
||||||
"id": 1,
|
|
||||||
"logprob": null,
|
|
||||||
"text": "<s>"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 1724,
|
|
||||||
"logprob": -7.6914062,
|
|
||||||
"text": "What"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 338,
|
|
||||||
"logprob": -1.4746094,
|
|
||||||
"text": "is"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 21784,
|
|
||||||
"logprob": -9.390625,
|
|
||||||
"text": "Deep"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 29257,
|
|
||||||
"logprob": -1.8623047,
|
|
||||||
"text": "Learning"
|
|
||||||
},
|
|
||||||
{
|
|
||||||
"id": 29973,
|
|
||||||
"logprob": -0.7558594,
|
|
||||||
"text": "?"
|
|
||||||
}
|
|
||||||
],
|
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -3,7 +3,103 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<s>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 4911,
|
||||||
|
"logprob": -6.9765625,
|
||||||
|
"text": "User"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 29901,
|
||||||
|
"logprob": -0.0059432983,
|
||||||
|
"text": ":"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32000,
|
||||||
|
"logprob": -0.8408203,
|
||||||
|
"text": "<fake_token_around_image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32001,
|
||||||
|
"logprob": -9.906292e-05,
|
||||||
|
"text": "<image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32000,
|
||||||
|
"logprob": -2.3841858e-07,
|
||||||
|
"text": "<fake_token_around_image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1815,
|
||||||
|
"logprob": -4.1679688,
|
||||||
|
"text": "Can"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 366,
|
||||||
|
"logprob": -0.014099121,
|
||||||
|
"text": "you"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 2649,
|
||||||
|
"logprob": -4.4609375,
|
||||||
|
"text": "tell"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 592,
|
||||||
|
"logprob": -0.29882812,
|
||||||
|
"text": "me"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 263,
|
||||||
|
"logprob": -4.1445312,
|
||||||
|
"text": "a"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1407,
|
||||||
|
"logprob": -9.3828125,
|
||||||
|
"text": "very"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3273,
|
||||||
|
"logprob": -1.9736328,
|
||||||
|
"text": "short"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 5828,
|
||||||
|
"logprob": -0.2800293,
|
||||||
|
"text": "story"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 2729,
|
||||||
|
"logprob": -3.5625,
|
||||||
|
"text": "based"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 373,
|
||||||
|
"logprob": -0.0006427765,
|
||||||
|
"text": "on"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 278,
|
||||||
|
"logprob": -0.13952637,
|
||||||
|
"text": "the"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1967,
|
||||||
|
"logprob": -0.068115234,
|
||||||
|
"text": "image"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 29973,
|
||||||
|
"logprob": -0.16357422,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -4,7 +4,103 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<s>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 4911,
|
||||||
|
"logprob": -6.9804688,
|
||||||
|
"text": "User"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 29901,
|
||||||
|
"logprob": -0.006122589,
|
||||||
|
"text": ":"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32000,
|
||||||
|
"logprob": -0.8417969,
|
||||||
|
"text": "<fake_token_around_image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32001,
|
||||||
|
"logprob": -9.918213e-05,
|
||||||
|
"text": "<image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32000,
|
||||||
|
"logprob": -2.3841858e-07,
|
||||||
|
"text": "<fake_token_around_image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1815,
|
||||||
|
"logprob": -4.1679688,
|
||||||
|
"text": "Can"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 366,
|
||||||
|
"logprob": -0.014091492,
|
||||||
|
"text": "you"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 2649,
|
||||||
|
"logprob": -4.4726562,
|
||||||
|
"text": "tell"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 592,
|
||||||
|
"logprob": -0.2998047,
|
||||||
|
"text": "me"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 263,
|
||||||
|
"logprob": -4.15625,
|
||||||
|
"text": "a"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1407,
|
||||||
|
"logprob": -9.3828125,
|
||||||
|
"text": "very"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3273,
|
||||||
|
"logprob": -1.9716797,
|
||||||
|
"text": "short"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 5828,
|
||||||
|
"logprob": -0.27734375,
|
||||||
|
"text": "story"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 2729,
|
||||||
|
"logprob": -3.5605469,
|
||||||
|
"text": "based"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 373,
|
||||||
|
"logprob": -0.00064468384,
|
||||||
|
"text": "on"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 278,
|
||||||
|
"logprob": -0.14160156,
|
||||||
|
"text": "the"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1967,
|
||||||
|
"logprob": -0.06915283,
|
||||||
|
"text": "image"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 29973,
|
||||||
|
"logprob": -0.16381836,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -76,7 +172,103 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<s>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 4911,
|
||||||
|
"logprob": -6.9804688,
|
||||||
|
"text": "User"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 29901,
|
||||||
|
"logprob": -0.006122589,
|
||||||
|
"text": ":"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32000,
|
||||||
|
"logprob": -0.8417969,
|
||||||
|
"text": "<fake_token_around_image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32001,
|
||||||
|
"logprob": -9.942055e-05,
|
||||||
|
"text": "<image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32000,
|
||||||
|
"logprob": -2.3841858e-07,
|
||||||
|
"text": "<fake_token_around_image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1815,
|
||||||
|
"logprob": -4.1679688,
|
||||||
|
"text": "Can"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 366,
|
||||||
|
"logprob": -0.014091492,
|
||||||
|
"text": "you"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 2649,
|
||||||
|
"logprob": -4.4726562,
|
||||||
|
"text": "tell"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 592,
|
||||||
|
"logprob": -0.2998047,
|
||||||
|
"text": "me"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 263,
|
||||||
|
"logprob": -4.15625,
|
||||||
|
"text": "a"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1407,
|
||||||
|
"logprob": -9.3828125,
|
||||||
|
"text": "very"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3273,
|
||||||
|
"logprob": -1.9716797,
|
||||||
|
"text": "short"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 5828,
|
||||||
|
"logprob": -0.27734375,
|
||||||
|
"text": "story"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 2729,
|
||||||
|
"logprob": -3.5605469,
|
||||||
|
"text": "based"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 373,
|
||||||
|
"logprob": -0.0006451607,
|
||||||
|
"text": "on"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 278,
|
||||||
|
"logprob": -0.14160156,
|
||||||
|
"text": "the"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1967,
|
||||||
|
"logprob": -0.06915283,
|
||||||
|
"text": "image"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 29973,
|
||||||
|
"logprob": -0.16381836,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -148,7 +340,103 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<s>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 4911,
|
||||||
|
"logprob": -6.9804688,
|
||||||
|
"text": "User"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 29901,
|
||||||
|
"logprob": -0.006122589,
|
||||||
|
"text": ":"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32000,
|
||||||
|
"logprob": -0.8417969,
|
||||||
|
"text": "<fake_token_around_image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32001,
|
||||||
|
"logprob": -9.918213e-05,
|
||||||
|
"text": "<image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32000,
|
||||||
|
"logprob": -2.3841858e-07,
|
||||||
|
"text": "<fake_token_around_image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1815,
|
||||||
|
"logprob": -4.1679688,
|
||||||
|
"text": "Can"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 366,
|
||||||
|
"logprob": -0.014091492,
|
||||||
|
"text": "you"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 2649,
|
||||||
|
"logprob": -4.4726562,
|
||||||
|
"text": "tell"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 592,
|
||||||
|
"logprob": -0.2998047,
|
||||||
|
"text": "me"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 263,
|
||||||
|
"logprob": -4.15625,
|
||||||
|
"text": "a"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1407,
|
||||||
|
"logprob": -9.3828125,
|
||||||
|
"text": "very"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3273,
|
||||||
|
"logprob": -1.9716797,
|
||||||
|
"text": "short"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 5828,
|
||||||
|
"logprob": -0.27734375,
|
||||||
|
"text": "story"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 2729,
|
||||||
|
"logprob": -3.5605469,
|
||||||
|
"text": "based"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 373,
|
||||||
|
"logprob": -0.00064468384,
|
||||||
|
"text": "on"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 278,
|
||||||
|
"logprob": -0.14160156,
|
||||||
|
"text": "the"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1967,
|
||||||
|
"logprob": -0.06915283,
|
||||||
|
"text": "image"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 29973,
|
||||||
|
"logprob": -0.16381836,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -220,7 +508,103 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<s>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 4911,
|
||||||
|
"logprob": -6.9804688,
|
||||||
|
"text": "User"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 29901,
|
||||||
|
"logprob": -0.006122589,
|
||||||
|
"text": ":"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32000,
|
||||||
|
"logprob": -0.8417969,
|
||||||
|
"text": "<fake_token_around_image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32001,
|
||||||
|
"logprob": -9.942055e-05,
|
||||||
|
"text": "<image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32000,
|
||||||
|
"logprob": -2.3841858e-07,
|
||||||
|
"text": "<fake_token_around_image>"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1815,
|
||||||
|
"logprob": -4.1679688,
|
||||||
|
"text": "Can"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 366,
|
||||||
|
"logprob": -0.014091492,
|
||||||
|
"text": "you"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 2649,
|
||||||
|
"logprob": -4.4726562,
|
||||||
|
"text": "tell"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 592,
|
||||||
|
"logprob": -0.2998047,
|
||||||
|
"text": "me"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 263,
|
||||||
|
"logprob": -4.15625,
|
||||||
|
"text": "a"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1407,
|
||||||
|
"logprob": -9.3828125,
|
||||||
|
"text": "very"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 3273,
|
||||||
|
"logprob": -1.9716797,
|
||||||
|
"text": "short"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 5828,
|
||||||
|
"logprob": -0.27734375,
|
||||||
|
"text": "story"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 2729,
|
||||||
|
"logprob": -3.5605469,
|
||||||
|
"text": "based"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 373,
|
||||||
|
"logprob": -0.0006451607,
|
||||||
|
"text": "on"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 278,
|
||||||
|
"logprob": -0.14160156,
|
||||||
|
"text": "the"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 1967,
|
||||||
|
"logprob": -0.06915283,
|
||||||
|
"text": "image"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 29973,
|
||||||
|
"logprob": -0.16381836,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -3,7 +3,33 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 2502,
|
||||||
|
"logprob": null,
|
||||||
|
"text": " red"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 13,
|
||||||
|
"logprob": -2.734375,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 8862,
|
||||||
|
"logprob": -3.6875,
|
||||||
|
"text": " yellow"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 13,
|
||||||
|
"logprob": -0.40234375,
|
||||||
|
"text": ","
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 209,
|
||||||
|
"logprob": -8.25,
|
||||||
|
"text": " "
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": 0,
|
"seed": 0,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -4,7 +4,33 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1276,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "What"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 310,
|
||||||
|
"logprob": -0.83984375,
|
||||||
|
"text": " is"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 18147,
|
||||||
|
"logprob": -12.8125,
|
||||||
|
"text": " Deep"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 20727,
|
||||||
|
"logprob": -2.84375,
|
||||||
|
"text": " Learning"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32,
|
||||||
|
"logprob": -1.25,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -77,7 +103,33 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1276,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "What"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 310,
|
||||||
|
"logprob": -0.80078125,
|
||||||
|
"text": " is"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 18147,
|
||||||
|
"logprob": -13.25,
|
||||||
|
"text": " Deep"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 20727,
|
||||||
|
"logprob": -2.828125,
|
||||||
|
"text": " Learning"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32,
|
||||||
|
"logprob": -1.1953125,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -150,7 +202,33 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1276,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "What"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 310,
|
||||||
|
"logprob": -0.80078125,
|
||||||
|
"text": " is"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 18147,
|
||||||
|
"logprob": -13.25,
|
||||||
|
"text": " Deep"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 20727,
|
||||||
|
"logprob": -2.828125,
|
||||||
|
"text": " Learning"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32,
|
||||||
|
"logprob": -1.1953125,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -223,7 +301,33 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1276,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "What"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 310,
|
||||||
|
"logprob": -0.80078125,
|
||||||
|
"text": " is"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 18147,
|
||||||
|
"logprob": -13.25,
|
||||||
|
"text": " Deep"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 20727,
|
||||||
|
"logprob": -2.828125,
|
||||||
|
"text": " Learning"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32,
|
||||||
|
"logprob": -1.1953125,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -3,7 +3,33 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 17,
|
"generated_tokens": 17,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1276,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "What"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 310,
|
||||||
|
"logprob": -1.5117188,
|
||||||
|
"text": " is"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 18147,
|
||||||
|
"logprob": -8.96875,
|
||||||
|
"text": " Deep"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 20727,
|
||||||
|
"logprob": -1.953125,
|
||||||
|
"text": " Learning"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32,
|
||||||
|
"logprob": -0.94189453,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -4,7 +4,33 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 17,
|
"generated_tokens": 17,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1276,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "What"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 310,
|
||||||
|
"logprob": -1.5117188,
|
||||||
|
"text": " is"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 18147,
|
||||||
|
"logprob": -8.96875,
|
||||||
|
"text": " Deep"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 20727,
|
||||||
|
"logprob": -1.953125,
|
||||||
|
"text": " Learning"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32,
|
||||||
|
"logprob": -0.94189453,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -118,7 +144,33 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 17,
|
"generated_tokens": 17,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1276,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "What"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 310,
|
||||||
|
"logprob": -1.5,
|
||||||
|
"text": " is"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 18147,
|
||||||
|
"logprob": -8.984375,
|
||||||
|
"text": " Deep"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 20727,
|
||||||
|
"logprob": -1.96875,
|
||||||
|
"text": " Learning"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32,
|
||||||
|
"logprob": -0.93359375,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -232,7 +284,33 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 17,
|
"generated_tokens": 17,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1276,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "What"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 310,
|
||||||
|
"logprob": -1.5,
|
||||||
|
"text": " is"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 18147,
|
||||||
|
"logprob": -8.984375,
|
||||||
|
"text": " Deep"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 20727,
|
||||||
|
"logprob": -1.96875,
|
||||||
|
"text": " Learning"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32,
|
||||||
|
"logprob": -0.93359375,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -346,7 +424,33 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 17,
|
"generated_tokens": 17,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 1276,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "What"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 310,
|
||||||
|
"logprob": -1.5,
|
||||||
|
"text": " is"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 18147,
|
||||||
|
"logprob": -8.984375,
|
||||||
|
"text": " Deep"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 20727,
|
||||||
|
"logprob": -1.96875,
|
||||||
|
"text": " Learning"
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"id": 32,
|
||||||
|
"logprob": -0.93359375,
|
||||||
|
"text": "?"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -3,7 +3,13 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "eos_token",
|
"finish_reason": "eos_token",
|
||||||
"generated_tokens": 5,
|
"generated_tokens": 5,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 0,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<pad>"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": 0,
|
"seed": 0,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -3,7 +3,13 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "length",
|
"finish_reason": "length",
|
||||||
"generated_tokens": 10,
|
"generated_tokens": 10,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 0,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<pad>"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": 0,
|
"seed": 0,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -4,7 +4,13 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "eos_token",
|
"finish_reason": "eos_token",
|
||||||
"generated_tokens": 6,
|
"generated_tokens": 6,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 0,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<pad>"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -52,7 +58,13 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "eos_token",
|
"finish_reason": "eos_token",
|
||||||
"generated_tokens": 6,
|
"generated_tokens": 6,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 0,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<pad>"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -100,7 +112,13 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "eos_token",
|
"finish_reason": "eos_token",
|
||||||
"generated_tokens": 6,
|
"generated_tokens": 6,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 0,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<pad>"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -148,7 +166,13 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "eos_token",
|
"finish_reason": "eos_token",
|
||||||
"generated_tokens": 6,
|
"generated_tokens": 6,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 0,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<pad>"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -3,7 +3,13 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "eos_token",
|
"finish_reason": "eos_token",
|
||||||
"generated_tokens": 7,
|
"generated_tokens": 7,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 0,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<pad>"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -4,7 +4,13 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "eos_token",
|
"finish_reason": "eos_token",
|
||||||
"generated_tokens": 7,
|
"generated_tokens": 7,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 0,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<pad>"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -58,7 +64,13 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "eos_token",
|
"finish_reason": "eos_token",
|
||||||
"generated_tokens": 7,
|
"generated_tokens": 7,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 0,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<pad>"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -112,7 +124,13 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "eos_token",
|
"finish_reason": "eos_token",
|
||||||
"generated_tokens": 7,
|
"generated_tokens": 7,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 0,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<pad>"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
@ -166,7 +184,13 @@
|
|||||||
"best_of_sequences": null,
|
"best_of_sequences": null,
|
||||||
"finish_reason": "eos_token",
|
"finish_reason": "eos_token",
|
||||||
"generated_tokens": 7,
|
"generated_tokens": 7,
|
||||||
"prefill": [],
|
"prefill": [
|
||||||
|
{
|
||||||
|
"id": 0,
|
||||||
|
"logprob": null,
|
||||||
|
"text": "<pad>"
|
||||||
|
}
|
||||||
|
],
|
||||||
"seed": null,
|
"seed": null,
|
||||||
"tokens": [
|
"tokens": [
|
||||||
{
|
{
|
||||||
|
@ -80,7 +80,7 @@ fn get_config(
|
|||||||
};
|
};
|
||||||
|
|
||||||
let content = std::fs::read_to_string(filename)?;
|
let content = std::fs::read_to_string(filename)?;
|
||||||
let config: RawConfig = serde_json::from_str(&content)?;
|
let config: RawConfig = serde_json::from_str(&content).expect("?");
|
||||||
|
|
||||||
let config: Config = config.into();
|
let config: Config = config.into();
|
||||||
Ok(config)
|
Ok(config)
|
||||||
@ -171,6 +171,8 @@ struct RawConfig {
|
|||||||
head_dim: Option<usize>,
|
head_dim: Option<usize>,
|
||||||
vision_config: Option<VisionConfig>,
|
vision_config: Option<VisionConfig>,
|
||||||
is_encoder_decoder: Option<bool>,
|
is_encoder_decoder: Option<bool>,
|
||||||
|
#[serde(rename = "num_experts_per_tok")]
|
||||||
|
experts: Option<usize>,
|
||||||
}
|
}
|
||||||
|
|
||||||
#[derive(Deserialize)]
|
#[derive(Deserialize)]
|
||||||
@ -194,6 +196,7 @@ struct Config {
|
|||||||
model_type: Option<String>,
|
model_type: Option<String>,
|
||||||
vision_config: Option<VisionConfig>,
|
vision_config: Option<VisionConfig>,
|
||||||
is_encoder_decoder: bool,
|
is_encoder_decoder: bool,
|
||||||
|
experts: Option<usize>,
|
||||||
}
|
}
|
||||||
|
|
||||||
impl Config {
|
impl Config {
|
||||||
@ -202,7 +205,11 @@ impl Config {
|
|||||||
let num_kv_heads = self.num_kv_heads? as u64;
|
let num_kv_heads = self.num_kv_heads? as u64;
|
||||||
let head_dim = self.head_dim? as u64;
|
let head_dim = self.head_dim? as u64;
|
||||||
let hidden_size = self.hidden_size? as u64;
|
let hidden_size = self.hidden_size? as u64;
|
||||||
let intermediate_size = self.intermediate_size? as u64;
|
let intermediate_size = if let Some(experts) = self.experts {
|
||||||
|
(self.intermediate_size? * experts) as u64
|
||||||
|
} else {
|
||||||
|
self.intermediate_size? as u64
|
||||||
|
};
|
||||||
let num_layers = self.num_layers? as u64;
|
let num_layers = self.num_layers? as u64;
|
||||||
|
|
||||||
let q_flops = 2 * num_heads * head_dim * hidden_size;
|
let q_flops = 2 * num_heads * head_dim * hidden_size;
|
||||||
@ -245,6 +252,7 @@ impl From<RawConfig> for Config {
|
|||||||
let model_type = other.model_type;
|
let model_type = other.model_type;
|
||||||
let vision_config = other.vision_config;
|
let vision_config = other.vision_config;
|
||||||
let is_encoder_decoder = other.is_encoder_decoder.unwrap_or(false);
|
let is_encoder_decoder = other.is_encoder_decoder.unwrap_or(false);
|
||||||
|
let experts = other.experts;
|
||||||
Config {
|
Config {
|
||||||
max_position_embeddings,
|
max_position_embeddings,
|
||||||
quantize,
|
quantize,
|
||||||
@ -257,6 +265,7 @@ impl From<RawConfig> for Config {
|
|||||||
num_kv_heads,
|
num_kv_heads,
|
||||||
intermediate_size,
|
intermediate_size,
|
||||||
num_layers,
|
num_layers,
|
||||||
|
experts,
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
Loading…
Reference in New Issue
Block a user