mirror of
https://github.com/huggingface/text-generation-inference.git
synced 2025-09-09 19:34:53 +00:00
remove logprobs
This commit is contained in:
parent
9fcf03d13c
commit
8d0f8c2c30
2
.github/workflows/build.yaml
vendored
2
.github/workflows/build.yaml
vendored
@ -217,7 +217,7 @@ jobs:
|
||||
run: |
|
||||
export DOCKER_IMAGE=registry.internal.huggingface.tech/api-inference/community/text-generation-inference:sha-${{ env.GITHUB_SHA_SHORT }}
|
||||
export HUGGING_FACE_HUB_TOKEN=${{ secrets.HUGGING_FACE_HUB_TOKEN }}
|
||||
make integration-tests
|
||||
pytest -s -vv integration-tests
|
||||
|
||||
stop-runner:
|
||||
name: Stop self-hosted EC2 runner
|
||||
|
@ -7,6 +7,7 @@ import docker
|
||||
|
||||
from docker.errors import NotFound
|
||||
from typing import Optional, List
|
||||
from syrupy.filters import props
|
||||
|
||||
from text_generation import AsyncClient
|
||||
from text_generation.types import Response
|
||||
@ -16,6 +17,11 @@ HUGGING_FACE_HUB_TOKEN = os.getenv("HUGGING_FACE_HUB_TOKEN", None)
|
||||
DOCKER_VOLUME = os.getenv("DOCKER_VOLUME", "/data")
|
||||
|
||||
|
||||
@pytest.fixture
|
||||
def snapshot_test(snapshot):
|
||||
return lambda value: value == snapshot(exclude=props("logprob"))
|
||||
|
||||
|
||||
@pytest.fixture(scope="module")
|
||||
def event_loop():
|
||||
loop = asyncio.get_event_loop()
|
||||
@ -135,6 +141,6 @@ def generate_load():
|
||||
]
|
||||
|
||||
results = await asyncio.gather(*futures)
|
||||
return [r.generated_text for r in results]
|
||||
return [r.dict() for r in results]
|
||||
|
||||
return generate_load_inner
|
||||
|
@ -8,57 +8,46 @@
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 17934,
|
||||
'logprob': None,
|
||||
'text': 'Pour',
|
||||
}),
|
||||
dict({
|
||||
'id': 49833,
|
||||
'logprob': -10.5625,
|
||||
'text': ' dég',
|
||||
}),
|
||||
dict({
|
||||
'id': 21543,
|
||||
'logprob': -0.14770508,
|
||||
'text': 'uster',
|
||||
}),
|
||||
dict({
|
||||
'id': 447,
|
||||
'logprob': -1.9287109,
|
||||
'text': ' un',
|
||||
}),
|
||||
dict({
|
||||
'id': 46341,
|
||||
'logprob': -15.4609375,
|
||||
'text': ' ort',
|
||||
}),
|
||||
dict({
|
||||
'id': 35567,
|
||||
'logprob': -7.5585938,
|
||||
'text': 'olan',
|
||||
}),
|
||||
dict({
|
||||
'id': 15,
|
||||
'logprob': -1.4003906,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 1669,
|
||||
'logprob': -1.5673828,
|
||||
'text': ' il',
|
||||
}),
|
||||
dict({
|
||||
'id': 11580,
|
||||
'logprob': -0.94628906,
|
||||
'text': ' faut',
|
||||
}),
|
||||
dict({
|
||||
'id': 3913,
|
||||
'logprob': -3.703125,
|
||||
'text': ' tout',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'logprob': -1.5732422,
|
||||
'text': " d'abord",
|
||||
}),
|
||||
]),
|
||||
@ -66,61 +55,51 @@
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 578,
|
||||
'logprob': -1.6591797,
|
||||
'special': False,
|
||||
'text': ' le',
|
||||
}),
|
||||
dict({
|
||||
'id': 5608,
|
||||
'logprob': -2.4492188,
|
||||
'special': False,
|
||||
'text': ' faire',
|
||||
}),
|
||||
dict({
|
||||
'id': 159570,
|
||||
'logprob': -6.6835938,
|
||||
'special': False,
|
||||
'text': ' réch',
|
||||
}),
|
||||
dict({
|
||||
'id': 810,
|
||||
'logprob': 0.0,
|
||||
'special': False,
|
||||
'text': 'au',
|
||||
}),
|
||||
dict({
|
||||
'id': 12736,
|
||||
'logprob': 0.0,
|
||||
'special': False,
|
||||
'text': 'ffer',
|
||||
}),
|
||||
dict({
|
||||
'id': 1742,
|
||||
'logprob': -2.5175781,
|
||||
'special': False,
|
||||
'text': ' au',
|
||||
}),
|
||||
dict({
|
||||
'id': 6105,
|
||||
'logprob': -2.0078125,
|
||||
'special': False,
|
||||
'text': ' bain',
|
||||
}),
|
||||
dict({
|
||||
'id': 88254,
|
||||
'logprob': -0.12695312,
|
||||
'special': False,
|
||||
'text': '-mar',
|
||||
}),
|
||||
dict({
|
||||
'id': 641,
|
||||
'logprob': 0.0,
|
||||
'special': False,
|
||||
'text': 'ie',
|
||||
}),
|
||||
dict({
|
||||
'id': 2940,
|
||||
'logprob': -3.5175781,
|
||||
'special': False,
|
||||
'text': ' avec',
|
||||
}),
|
||||
@ -138,27 +117,22 @@
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 15,
|
||||
'logprob': None,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 1669,
|
||||
'logprob': -5.4414062,
|
||||
'text': ' il',
|
||||
}),
|
||||
dict({
|
||||
'id': 11580,
|
||||
'logprob': -2.3378906,
|
||||
'text': ' faut',
|
||||
}),
|
||||
dict({
|
||||
'id': 3913,
|
||||
'logprob': -4.3554688,
|
||||
'text': ' tout',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'logprob': -2.9238281,
|
||||
'text': " d'abord",
|
||||
}),
|
||||
]),
|
||||
@ -166,61 +140,51 @@
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 408,
|
||||
'logprob': -1.9267578,
|
||||
'special': False,
|
||||
'text': ' que',
|
||||
}),
|
||||
dict({
|
||||
'id': 20288,
|
||||
'logprob': -2.9257812,
|
||||
'special': False,
|
||||
'text': " l'on",
|
||||
}),
|
||||
dict({
|
||||
'id': 22255,
|
||||
'logprob': -2.8964844,
|
||||
'special': False,
|
||||
'text': ' trouve',
|
||||
}),
|
||||
dict({
|
||||
'id': 1622,
|
||||
'logprob': -1.1083984,
|
||||
'special': False,
|
||||
'text': ' une',
|
||||
}),
|
||||
dict({
|
||||
'id': 187079,
|
||||
'logprob': -7.796875,
|
||||
'special': False,
|
||||
'text': ' posture',
|
||||
}),
|
||||
dict({
|
||||
'id': 501,
|
||||
'logprob': -5.390625,
|
||||
'special': False,
|
||||
'text': ' par',
|
||||
}),
|
||||
dict({
|
||||
'id': 8741,
|
||||
'logprob': -0.34936523,
|
||||
'special': False,
|
||||
'text': ' rapport',
|
||||
}),
|
||||
dict({
|
||||
'id': 693,
|
||||
'logprob': 0.0,
|
||||
'special': False,
|
||||
'text': ' à',
|
||||
}),
|
||||
dict({
|
||||
'id': 366,
|
||||
'logprob': -2.3378906,
|
||||
'special': False,
|
||||
'text': ' la',
|
||||
}),
|
||||
dict({
|
||||
'id': 36503,
|
||||
'logprob': -3.6640625,
|
||||
'special': False,
|
||||
'text': ' pratique',
|
||||
}),
|
||||
@ -231,9 +195,433 @@
|
||||
# ---
|
||||
# name: test_bloom_560m_load
|
||||
list([
|
||||
" le faire cuire dans de l'eau bouillante sal",
|
||||
" le faire cuire dans de l'eau bouillante sal",
|
||||
" le faire cuire dans de l'eau bouillante sal",
|
||||
" le faire cuire dans de l'eau bouillante sal",
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 17934,
|
||||
'text': 'Pour',
|
||||
}),
|
||||
dict({
|
||||
'id': 49833,
|
||||
'text': ' dég',
|
||||
}),
|
||||
dict({
|
||||
'id': 21543,
|
||||
'text': 'uster',
|
||||
}),
|
||||
dict({
|
||||
'id': 447,
|
||||
'text': ' un',
|
||||
}),
|
||||
dict({
|
||||
'id': 46341,
|
||||
'text': ' ort',
|
||||
}),
|
||||
dict({
|
||||
'id': 35567,
|
||||
'text': 'olan',
|
||||
}),
|
||||
dict({
|
||||
'id': 15,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 1669,
|
||||
'text': ' il',
|
||||
}),
|
||||
dict({
|
||||
'id': 11580,
|
||||
'text': ' faut',
|
||||
}),
|
||||
dict({
|
||||
'id': 3913,
|
||||
'text': ' tout',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'text': " d'abord",
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 578,
|
||||
'special': False,
|
||||
'text': ' le',
|
||||
}),
|
||||
dict({
|
||||
'id': 5608,
|
||||
'special': False,
|
||||
'text': ' faire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1767,
|
||||
'special': False,
|
||||
'text': ' cu',
|
||||
}),
|
||||
dict({
|
||||
'id': 1273,
|
||||
'special': False,
|
||||
'text': 'ire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1486,
|
||||
'special': False,
|
||||
'text': ' dans',
|
||||
}),
|
||||
dict({
|
||||
'id': 283,
|
||||
'special': False,
|
||||
'text': ' de',
|
||||
}),
|
||||
dict({
|
||||
'id': 40410,
|
||||
'special': False,
|
||||
'text': " l'eau",
|
||||
}),
|
||||
dict({
|
||||
'id': 20226,
|
||||
'special': False,
|
||||
'text': ' bou',
|
||||
}),
|
||||
dict({
|
||||
'id': 172483,
|
||||
'special': False,
|
||||
'text': 'illante',
|
||||
}),
|
||||
dict({
|
||||
'id': 2805,
|
||||
'special': False,
|
||||
'text': ' sal',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': " le faire cuire dans de l'eau bouillante sal",
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 17934,
|
||||
'text': 'Pour',
|
||||
}),
|
||||
dict({
|
||||
'id': 49833,
|
||||
'text': ' dég',
|
||||
}),
|
||||
dict({
|
||||
'id': 21543,
|
||||
'text': 'uster',
|
||||
}),
|
||||
dict({
|
||||
'id': 447,
|
||||
'text': ' un',
|
||||
}),
|
||||
dict({
|
||||
'id': 46341,
|
||||
'text': ' ort',
|
||||
}),
|
||||
dict({
|
||||
'id': 35567,
|
||||
'text': 'olan',
|
||||
}),
|
||||
dict({
|
||||
'id': 15,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 1669,
|
||||
'text': ' il',
|
||||
}),
|
||||
dict({
|
||||
'id': 11580,
|
||||
'text': ' faut',
|
||||
}),
|
||||
dict({
|
||||
'id': 3913,
|
||||
'text': ' tout',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'text': " d'abord",
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 578,
|
||||
'special': False,
|
||||
'text': ' le',
|
||||
}),
|
||||
dict({
|
||||
'id': 5608,
|
||||
'special': False,
|
||||
'text': ' faire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1767,
|
||||
'special': False,
|
||||
'text': ' cu',
|
||||
}),
|
||||
dict({
|
||||
'id': 1273,
|
||||
'special': False,
|
||||
'text': 'ire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1486,
|
||||
'special': False,
|
||||
'text': ' dans',
|
||||
}),
|
||||
dict({
|
||||
'id': 283,
|
||||
'special': False,
|
||||
'text': ' de',
|
||||
}),
|
||||
dict({
|
||||
'id': 40410,
|
||||
'special': False,
|
||||
'text': " l'eau",
|
||||
}),
|
||||
dict({
|
||||
'id': 20226,
|
||||
'special': False,
|
||||
'text': ' bou',
|
||||
}),
|
||||
dict({
|
||||
'id': 172483,
|
||||
'special': False,
|
||||
'text': 'illante',
|
||||
}),
|
||||
dict({
|
||||
'id': 2805,
|
||||
'special': False,
|
||||
'text': ' sal',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': " le faire cuire dans de l'eau bouillante sal",
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 17934,
|
||||
'text': 'Pour',
|
||||
}),
|
||||
dict({
|
||||
'id': 49833,
|
||||
'text': ' dég',
|
||||
}),
|
||||
dict({
|
||||
'id': 21543,
|
||||
'text': 'uster',
|
||||
}),
|
||||
dict({
|
||||
'id': 447,
|
||||
'text': ' un',
|
||||
}),
|
||||
dict({
|
||||
'id': 46341,
|
||||
'text': ' ort',
|
||||
}),
|
||||
dict({
|
||||
'id': 35567,
|
||||
'text': 'olan',
|
||||
}),
|
||||
dict({
|
||||
'id': 15,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 1669,
|
||||
'text': ' il',
|
||||
}),
|
||||
dict({
|
||||
'id': 11580,
|
||||
'text': ' faut',
|
||||
}),
|
||||
dict({
|
||||
'id': 3913,
|
||||
'text': ' tout',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'text': " d'abord",
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 578,
|
||||
'special': False,
|
||||
'text': ' le',
|
||||
}),
|
||||
dict({
|
||||
'id': 5608,
|
||||
'special': False,
|
||||
'text': ' faire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1767,
|
||||
'special': False,
|
||||
'text': ' cu',
|
||||
}),
|
||||
dict({
|
||||
'id': 1273,
|
||||
'special': False,
|
||||
'text': 'ire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1486,
|
||||
'special': False,
|
||||
'text': ' dans',
|
||||
}),
|
||||
dict({
|
||||
'id': 283,
|
||||
'special': False,
|
||||
'text': ' de',
|
||||
}),
|
||||
dict({
|
||||
'id': 40410,
|
||||
'special': False,
|
||||
'text': " l'eau",
|
||||
}),
|
||||
dict({
|
||||
'id': 20226,
|
||||
'special': False,
|
||||
'text': ' bou',
|
||||
}),
|
||||
dict({
|
||||
'id': 172483,
|
||||
'special': False,
|
||||
'text': 'illante',
|
||||
}),
|
||||
dict({
|
||||
'id': 2805,
|
||||
'special': False,
|
||||
'text': ' sal',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': " le faire cuire dans de l'eau bouillante sal",
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 17934,
|
||||
'text': 'Pour',
|
||||
}),
|
||||
dict({
|
||||
'id': 49833,
|
||||
'text': ' dég',
|
||||
}),
|
||||
dict({
|
||||
'id': 21543,
|
||||
'text': 'uster',
|
||||
}),
|
||||
dict({
|
||||
'id': 447,
|
||||
'text': ' un',
|
||||
}),
|
||||
dict({
|
||||
'id': 46341,
|
||||
'text': ' ort',
|
||||
}),
|
||||
dict({
|
||||
'id': 35567,
|
||||
'text': 'olan',
|
||||
}),
|
||||
dict({
|
||||
'id': 15,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 1669,
|
||||
'text': ' il',
|
||||
}),
|
||||
dict({
|
||||
'id': 11580,
|
||||
'text': ' faut',
|
||||
}),
|
||||
dict({
|
||||
'id': 3913,
|
||||
'text': ' tout',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'text': " d'abord",
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 578,
|
||||
'special': False,
|
||||
'text': ' le',
|
||||
}),
|
||||
dict({
|
||||
'id': 5608,
|
||||
'special': False,
|
||||
'text': ' faire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1767,
|
||||
'special': False,
|
||||
'text': ' cu',
|
||||
}),
|
||||
dict({
|
||||
'id': 1273,
|
||||
'special': False,
|
||||
'text': 'ire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1486,
|
||||
'special': False,
|
||||
'text': ' dans',
|
||||
}),
|
||||
dict({
|
||||
'id': 283,
|
||||
'special': False,
|
||||
'text': ' de',
|
||||
}),
|
||||
dict({
|
||||
'id': 40410,
|
||||
'special': False,
|
||||
'text': " l'eau",
|
||||
}),
|
||||
dict({
|
||||
'id': 20226,
|
||||
'special': False,
|
||||
'text': ' bou',
|
||||
}),
|
||||
dict({
|
||||
'id': 172483,
|
||||
'special': False,
|
||||
'text': 'illante',
|
||||
}),
|
||||
dict({
|
||||
'id': 2805,
|
||||
'special': False,
|
||||
'text': ' sal',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': " le faire cuire dans de l'eau bouillante sal",
|
||||
}),
|
||||
])
|
||||
# ---
|
||||
|
@ -8,57 +8,46 @@
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 17934,
|
||||
'logprob': None,
|
||||
'text': 'Pour',
|
||||
}),
|
||||
dict({
|
||||
'id': 49833,
|
||||
'logprob': -10.5390625,
|
||||
'text': ' dég',
|
||||
}),
|
||||
dict({
|
||||
'id': 21543,
|
||||
'logprob': -0.14758301,
|
||||
'text': 'uster',
|
||||
}),
|
||||
dict({
|
||||
'id': 447,
|
||||
'logprob': -1.9296875,
|
||||
'text': ' un',
|
||||
}),
|
||||
dict({
|
||||
'id': 46341,
|
||||
'logprob': -15.4453125,
|
||||
'text': ' ort',
|
||||
}),
|
||||
dict({
|
||||
'id': 35567,
|
||||
'logprob': -7.59375,
|
||||
'text': 'olan',
|
||||
}),
|
||||
dict({
|
||||
'id': 15,
|
||||
'logprob': -1.3994141,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 1669,
|
||||
'logprob': -1.578125,
|
||||
'text': ' il',
|
||||
}),
|
||||
dict({
|
||||
'id': 11580,
|
||||
'logprob': -0.9453125,
|
||||
'text': ' faut',
|
||||
}),
|
||||
dict({
|
||||
'id': 3913,
|
||||
'logprob': -3.7011719,
|
||||
'text': ' tout',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'logprob': -1.5732422,
|
||||
'text': " d'abord",
|
||||
}),
|
||||
]),
|
||||
@ -66,61 +55,51 @@
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 578,
|
||||
'logprob': -1.6474609,
|
||||
'special': False,
|
||||
'text': ' le',
|
||||
}),
|
||||
dict({
|
||||
'id': 5608,
|
||||
'logprob': -2.5097656,
|
||||
'special': False,
|
||||
'text': ' faire',
|
||||
}),
|
||||
dict({
|
||||
'id': 159570,
|
||||
'logprob': -6.65625,
|
||||
'special': False,
|
||||
'text': ' réch',
|
||||
}),
|
||||
dict({
|
||||
'id': 810,
|
||||
'logprob': 0.0,
|
||||
'special': False,
|
||||
'text': 'au',
|
||||
}),
|
||||
dict({
|
||||
'id': 12736,
|
||||
'logprob': 0.0,
|
||||
'special': False,
|
||||
'text': 'ffer',
|
||||
}),
|
||||
dict({
|
||||
'id': 1742,
|
||||
'logprob': -2.5859375,
|
||||
'special': False,
|
||||
'text': ' au',
|
||||
}),
|
||||
dict({
|
||||
'id': 6105,
|
||||
'logprob': -2.03125,
|
||||
'special': False,
|
||||
'text': ' bain',
|
||||
}),
|
||||
dict({
|
||||
'id': 88254,
|
||||
'logprob': -0.12695312,
|
||||
'special': False,
|
||||
'text': '-mar',
|
||||
}),
|
||||
dict({
|
||||
'id': 641,
|
||||
'logprob': 0.0,
|
||||
'special': False,
|
||||
'text': 'ie',
|
||||
}),
|
||||
dict({
|
||||
'id': 2940,
|
||||
'logprob': -3.5175781,
|
||||
'special': False,
|
||||
'text': ' avec',
|
||||
}),
|
||||
@ -131,9 +110,433 @@
|
||||
# ---
|
||||
# name: test_bloom_560m_sharded_load
|
||||
list([
|
||||
" le faire cuire dans de l'eau bouillante sal",
|
||||
" le faire cuire dans de l'eau bouillante sal",
|
||||
" le faire cuire dans de l'eau bouillante sal",
|
||||
" le faire cuire dans de l'eau bouillante sal",
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 17934,
|
||||
'text': 'Pour',
|
||||
}),
|
||||
dict({
|
||||
'id': 49833,
|
||||
'text': ' dég',
|
||||
}),
|
||||
dict({
|
||||
'id': 21543,
|
||||
'text': 'uster',
|
||||
}),
|
||||
dict({
|
||||
'id': 447,
|
||||
'text': ' un',
|
||||
}),
|
||||
dict({
|
||||
'id': 46341,
|
||||
'text': ' ort',
|
||||
}),
|
||||
dict({
|
||||
'id': 35567,
|
||||
'text': 'olan',
|
||||
}),
|
||||
dict({
|
||||
'id': 15,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 1669,
|
||||
'text': ' il',
|
||||
}),
|
||||
dict({
|
||||
'id': 11580,
|
||||
'text': ' faut',
|
||||
}),
|
||||
dict({
|
||||
'id': 3913,
|
||||
'text': ' tout',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'text': " d'abord",
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 578,
|
||||
'special': False,
|
||||
'text': ' le',
|
||||
}),
|
||||
dict({
|
||||
'id': 5608,
|
||||
'special': False,
|
||||
'text': ' faire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1767,
|
||||
'special': False,
|
||||
'text': ' cu',
|
||||
}),
|
||||
dict({
|
||||
'id': 1273,
|
||||
'special': False,
|
||||
'text': 'ire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1486,
|
||||
'special': False,
|
||||
'text': ' dans',
|
||||
}),
|
||||
dict({
|
||||
'id': 283,
|
||||
'special': False,
|
||||
'text': ' de',
|
||||
}),
|
||||
dict({
|
||||
'id': 40410,
|
||||
'special': False,
|
||||
'text': " l'eau",
|
||||
}),
|
||||
dict({
|
||||
'id': 20226,
|
||||
'special': False,
|
||||
'text': ' bou',
|
||||
}),
|
||||
dict({
|
||||
'id': 172483,
|
||||
'special': False,
|
||||
'text': 'illante',
|
||||
}),
|
||||
dict({
|
||||
'id': 2805,
|
||||
'special': False,
|
||||
'text': ' sal',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': " le faire cuire dans de l'eau bouillante sal",
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 17934,
|
||||
'text': 'Pour',
|
||||
}),
|
||||
dict({
|
||||
'id': 49833,
|
||||
'text': ' dég',
|
||||
}),
|
||||
dict({
|
||||
'id': 21543,
|
||||
'text': 'uster',
|
||||
}),
|
||||
dict({
|
||||
'id': 447,
|
||||
'text': ' un',
|
||||
}),
|
||||
dict({
|
||||
'id': 46341,
|
||||
'text': ' ort',
|
||||
}),
|
||||
dict({
|
||||
'id': 35567,
|
||||
'text': 'olan',
|
||||
}),
|
||||
dict({
|
||||
'id': 15,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 1669,
|
||||
'text': ' il',
|
||||
}),
|
||||
dict({
|
||||
'id': 11580,
|
||||
'text': ' faut',
|
||||
}),
|
||||
dict({
|
||||
'id': 3913,
|
||||
'text': ' tout',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'text': " d'abord",
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 578,
|
||||
'special': False,
|
||||
'text': ' le',
|
||||
}),
|
||||
dict({
|
||||
'id': 5608,
|
||||
'special': False,
|
||||
'text': ' faire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1767,
|
||||
'special': False,
|
||||
'text': ' cu',
|
||||
}),
|
||||
dict({
|
||||
'id': 1273,
|
||||
'special': False,
|
||||
'text': 'ire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1486,
|
||||
'special': False,
|
||||
'text': ' dans',
|
||||
}),
|
||||
dict({
|
||||
'id': 283,
|
||||
'special': False,
|
||||
'text': ' de',
|
||||
}),
|
||||
dict({
|
||||
'id': 40410,
|
||||
'special': False,
|
||||
'text': " l'eau",
|
||||
}),
|
||||
dict({
|
||||
'id': 20226,
|
||||
'special': False,
|
||||
'text': ' bou',
|
||||
}),
|
||||
dict({
|
||||
'id': 172483,
|
||||
'special': False,
|
||||
'text': 'illante',
|
||||
}),
|
||||
dict({
|
||||
'id': 2805,
|
||||
'special': False,
|
||||
'text': ' sal',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': " le faire cuire dans de l'eau bouillante sal",
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 17934,
|
||||
'text': 'Pour',
|
||||
}),
|
||||
dict({
|
||||
'id': 49833,
|
||||
'text': ' dég',
|
||||
}),
|
||||
dict({
|
||||
'id': 21543,
|
||||
'text': 'uster',
|
||||
}),
|
||||
dict({
|
||||
'id': 447,
|
||||
'text': ' un',
|
||||
}),
|
||||
dict({
|
||||
'id': 46341,
|
||||
'text': ' ort',
|
||||
}),
|
||||
dict({
|
||||
'id': 35567,
|
||||
'text': 'olan',
|
||||
}),
|
||||
dict({
|
||||
'id': 15,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 1669,
|
||||
'text': ' il',
|
||||
}),
|
||||
dict({
|
||||
'id': 11580,
|
||||
'text': ' faut',
|
||||
}),
|
||||
dict({
|
||||
'id': 3913,
|
||||
'text': ' tout',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'text': " d'abord",
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 578,
|
||||
'special': False,
|
||||
'text': ' le',
|
||||
}),
|
||||
dict({
|
||||
'id': 5608,
|
||||
'special': False,
|
||||
'text': ' faire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1767,
|
||||
'special': False,
|
||||
'text': ' cu',
|
||||
}),
|
||||
dict({
|
||||
'id': 1273,
|
||||
'special': False,
|
||||
'text': 'ire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1486,
|
||||
'special': False,
|
||||
'text': ' dans',
|
||||
}),
|
||||
dict({
|
||||
'id': 283,
|
||||
'special': False,
|
||||
'text': ' de',
|
||||
}),
|
||||
dict({
|
||||
'id': 40410,
|
||||
'special': False,
|
||||
'text': " l'eau",
|
||||
}),
|
||||
dict({
|
||||
'id': 20226,
|
||||
'special': False,
|
||||
'text': ' bou',
|
||||
}),
|
||||
dict({
|
||||
'id': 172483,
|
||||
'special': False,
|
||||
'text': 'illante',
|
||||
}),
|
||||
dict({
|
||||
'id': 2805,
|
||||
'special': False,
|
||||
'text': ' sal',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': " le faire cuire dans de l'eau bouillante sal",
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 17934,
|
||||
'text': 'Pour',
|
||||
}),
|
||||
dict({
|
||||
'id': 49833,
|
||||
'text': ' dég',
|
||||
}),
|
||||
dict({
|
||||
'id': 21543,
|
||||
'text': 'uster',
|
||||
}),
|
||||
dict({
|
||||
'id': 447,
|
||||
'text': ' un',
|
||||
}),
|
||||
dict({
|
||||
'id': 46341,
|
||||
'text': ' ort',
|
||||
}),
|
||||
dict({
|
||||
'id': 35567,
|
||||
'text': 'olan',
|
||||
}),
|
||||
dict({
|
||||
'id': 15,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 1669,
|
||||
'text': ' il',
|
||||
}),
|
||||
dict({
|
||||
'id': 11580,
|
||||
'text': ' faut',
|
||||
}),
|
||||
dict({
|
||||
'id': 3913,
|
||||
'text': ' tout',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'text': " d'abord",
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 578,
|
||||
'special': False,
|
||||
'text': ' le',
|
||||
}),
|
||||
dict({
|
||||
'id': 5608,
|
||||
'special': False,
|
||||
'text': ' faire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1767,
|
||||
'special': False,
|
||||
'text': ' cu',
|
||||
}),
|
||||
dict({
|
||||
'id': 1273,
|
||||
'special': False,
|
||||
'text': 'ire',
|
||||
}),
|
||||
dict({
|
||||
'id': 1486,
|
||||
'special': False,
|
||||
'text': ' dans',
|
||||
}),
|
||||
dict({
|
||||
'id': 283,
|
||||
'special': False,
|
||||
'text': ' de',
|
||||
}),
|
||||
dict({
|
||||
'id': 40410,
|
||||
'special': False,
|
||||
'text': " l'eau",
|
||||
}),
|
||||
dict({
|
||||
'id': 20226,
|
||||
'special': False,
|
||||
'text': ' bou',
|
||||
}),
|
||||
dict({
|
||||
'id': 172483,
|
||||
'special': False,
|
||||
'text': 'illante',
|
||||
}),
|
||||
dict({
|
||||
'id': 2805,
|
||||
'special': False,
|
||||
'text': ' sal',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': " le faire cuire dans de l'eau bouillante sal",
|
||||
}),
|
||||
])
|
||||
# ---
|
||||
|
@ -8,17 +8,14 @@
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 1,
|
||||
'logprob': None,
|
||||
'text': '<s>',
|
||||
}),
|
||||
dict({
|
||||
'id': 4321,
|
||||
'logprob': -8.6875,
|
||||
'text': 'Test',
|
||||
}),
|
||||
dict({
|
||||
'id': 2009,
|
||||
'logprob': -11.5546875,
|
||||
'text': 'request',
|
||||
}),
|
||||
]),
|
||||
@ -26,61 +23,51 @@
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 363,
|
||||
'logprob': -1.5380859,
|
||||
'special': False,
|
||||
'text': ' for',
|
||||
}),
|
||||
dict({
|
||||
'id': 847,
|
||||
'logprob': -2.5917969,
|
||||
'special': False,
|
||||
'text': ' /',
|
||||
}),
|
||||
dict({
|
||||
'id': 2754,
|
||||
'logprob': -2.2773438,
|
||||
'special': False,
|
||||
'text': 'api',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'logprob': -0.034362793,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 29894,
|
||||
'logprob': -0.96533203,
|
||||
'special': False,
|
||||
'text': 'v',
|
||||
}),
|
||||
dict({
|
||||
'id': 29896,
|
||||
'logprob': -0.36669922,
|
||||
'special': False,
|
||||
'text': '1',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'logprob': -0.013122559,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 16418,
|
||||
'logprob': -3.1503906,
|
||||
'special': False,
|
||||
'text': 'projects',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'logprob': -0.43652344,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 29896,
|
||||
'logprob': -1.9404297,
|
||||
'special': False,
|
||||
'text': '1',
|
||||
}),
|
||||
@ -98,17 +85,14 @@
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 1,
|
||||
'logprob': None,
|
||||
'text': '<s>',
|
||||
}),
|
||||
dict({
|
||||
'id': 4321,
|
||||
'logprob': -8.6875,
|
||||
'text': 'Test',
|
||||
}),
|
||||
dict({
|
||||
'id': 2009,
|
||||
'logprob': -11.5546875,
|
||||
'text': 'request',
|
||||
}),
|
||||
]),
|
||||
@ -116,55 +100,46 @@
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 5229,
|
||||
'logprob': -3.3085938,
|
||||
'special': False,
|
||||
'text': ' failed',
|
||||
}),
|
||||
dict({
|
||||
'id': 363,
|
||||
'logprob': -3.984375,
|
||||
'special': False,
|
||||
'text': ' for',
|
||||
}),
|
||||
dict({
|
||||
'id': 5641,
|
||||
'logprob': -6.53125,
|
||||
'special': False,
|
||||
'text': ' IP',
|
||||
}),
|
||||
dict({
|
||||
'id': 16428,
|
||||
'logprob': -3.1835938,
|
||||
'special': False,
|
||||
'text': ' Address',
|
||||
}),
|
||||
dict({
|
||||
'id': 29901,
|
||||
'logprob': -1.2324219,
|
||||
'special': False,
|
||||
'text': ':',
|
||||
}),
|
||||
dict({
|
||||
'id': 525,
|
||||
'logprob': -2.6855469,
|
||||
'special': False,
|
||||
'text': " '",
|
||||
}),
|
||||
dict({
|
||||
'id': 8516,
|
||||
'logprob': -7.1601562,
|
||||
'special': False,
|
||||
'text': 'None',
|
||||
}),
|
||||
dict({
|
||||
'id': 4286,
|
||||
'logprob': -2.4433594,
|
||||
'special': False,
|
||||
'text': "'.",
|
||||
}),
|
||||
dict({
|
||||
'id': 13,
|
||||
'logprob': -0.06530762,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
@ -173,7 +148,6 @@
|
||||
}),
|
||||
dict({
|
||||
'id': 294,
|
||||
'logprob': -7.953125,
|
||||
'special': False,
|
||||
'text': 'as',
|
||||
}),
|
||||
@ -187,9 +161,305 @@
|
||||
# ---
|
||||
# name: test_flash_llama_load
|
||||
list([
|
||||
'for /api/v1/projects/1',
|
||||
'for /api/v1/projects/1',
|
||||
'for /api/v1/projects/1',
|
||||
'for /api/v1/projects/1',
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 1,
|
||||
'text': '<s>',
|
||||
}),
|
||||
dict({
|
||||
'id': 4321,
|
||||
'text': 'Test',
|
||||
}),
|
||||
dict({
|
||||
'id': 2009,
|
||||
'text': 'request',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 363,
|
||||
'special': False,
|
||||
'text': ' for',
|
||||
}),
|
||||
dict({
|
||||
'id': 847,
|
||||
'special': False,
|
||||
'text': ' /',
|
||||
}),
|
||||
dict({
|
||||
'id': 2754,
|
||||
'special': False,
|
||||
'text': 'api',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 29894,
|
||||
'special': False,
|
||||
'text': 'v',
|
||||
}),
|
||||
dict({
|
||||
'id': 29896,
|
||||
'special': False,
|
||||
'text': '1',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 16418,
|
||||
'special': False,
|
||||
'text': 'projects',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 29896,
|
||||
'special': False,
|
||||
'text': '1',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'for /api/v1/projects/1',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 1,
|
||||
'text': '<s>',
|
||||
}),
|
||||
dict({
|
||||
'id': 4321,
|
||||
'text': 'Test',
|
||||
}),
|
||||
dict({
|
||||
'id': 2009,
|
||||
'text': 'request',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 363,
|
||||
'special': False,
|
||||
'text': ' for',
|
||||
}),
|
||||
dict({
|
||||
'id': 847,
|
||||
'special': False,
|
||||
'text': ' /',
|
||||
}),
|
||||
dict({
|
||||
'id': 2754,
|
||||
'special': False,
|
||||
'text': 'api',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 29894,
|
||||
'special': False,
|
||||
'text': 'v',
|
||||
}),
|
||||
dict({
|
||||
'id': 29896,
|
||||
'special': False,
|
||||
'text': '1',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 16418,
|
||||
'special': False,
|
||||
'text': 'projects',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 29896,
|
||||
'special': False,
|
||||
'text': '1',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'for /api/v1/projects/1',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 1,
|
||||
'text': '<s>',
|
||||
}),
|
||||
dict({
|
||||
'id': 4321,
|
||||
'text': 'Test',
|
||||
}),
|
||||
dict({
|
||||
'id': 2009,
|
||||
'text': 'request',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 363,
|
||||
'special': False,
|
||||
'text': ' for',
|
||||
}),
|
||||
dict({
|
||||
'id': 847,
|
||||
'special': False,
|
||||
'text': ' /',
|
||||
}),
|
||||
dict({
|
||||
'id': 2754,
|
||||
'special': False,
|
||||
'text': 'api',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 29894,
|
||||
'special': False,
|
||||
'text': 'v',
|
||||
}),
|
||||
dict({
|
||||
'id': 29896,
|
||||
'special': False,
|
||||
'text': '1',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 16418,
|
||||
'special': False,
|
||||
'text': 'projects',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 29896,
|
||||
'special': False,
|
||||
'text': '1',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'for /api/v1/projects/1',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 1,
|
||||
'text': '<s>',
|
||||
}),
|
||||
dict({
|
||||
'id': 4321,
|
||||
'text': 'Test',
|
||||
}),
|
||||
dict({
|
||||
'id': 2009,
|
||||
'text': 'request',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 363,
|
||||
'special': False,
|
||||
'text': ' for',
|
||||
}),
|
||||
dict({
|
||||
'id': 847,
|
||||
'special': False,
|
||||
'text': ' /',
|
||||
}),
|
||||
dict({
|
||||
'id': 2754,
|
||||
'special': False,
|
||||
'text': 'api',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 29894,
|
||||
'special': False,
|
||||
'text': 'v',
|
||||
}),
|
||||
dict({
|
||||
'id': 29896,
|
||||
'special': False,
|
||||
'text': '1',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 16418,
|
||||
'special': False,
|
||||
'text': 'projects',
|
||||
}),
|
||||
dict({
|
||||
'id': 29914,
|
||||
'special': False,
|
||||
'text': '/',
|
||||
}),
|
||||
dict({
|
||||
'id': 29896,
|
||||
'special': False,
|
||||
'text': '1',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'for /api/v1/projects/1',
|
||||
}),
|
||||
])
|
||||
# ---
|
||||
|
@ -8,92 +8,74 @@
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 50278,
|
||||
'logprob': None,
|
||||
'text': '<|prompter|>',
|
||||
}),
|
||||
dict({
|
||||
'id': 1276,
|
||||
'logprob': -8.03125,
|
||||
'text': 'What',
|
||||
}),
|
||||
dict({
|
||||
'id': 310,
|
||||
'logprob': -5.421875,
|
||||
'text': ' is',
|
||||
}),
|
||||
dict({
|
||||
'id': 247,
|
||||
'logprob': -2.1601562,
|
||||
'text': ' a',
|
||||
}),
|
||||
dict({
|
||||
'id': 1167,
|
||||
'logprob': -5.4609375,
|
||||
'text': ' mem',
|
||||
}),
|
||||
dict({
|
||||
'id': 70,
|
||||
'logprob': -0.005657196,
|
||||
'text': 'e',
|
||||
}),
|
||||
dict({
|
||||
'id': 13,
|
||||
'logprob': -7.28125,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 285,
|
||||
'logprob': -0.2980957,
|
||||
'text': ' and',
|
||||
}),
|
||||
dict({
|
||||
'id': 752,
|
||||
'logprob': -2.1679688,
|
||||
'text': ' what',
|
||||
}),
|
||||
dict({
|
||||
'id': 434,
|
||||
'logprob': -5.6210938,
|
||||
'text': "'s",
|
||||
}),
|
||||
dict({
|
||||
'id': 253,
|
||||
'logprob': -0.81103516,
|
||||
'text': ' the',
|
||||
}),
|
||||
dict({
|
||||
'id': 2892,
|
||||
'logprob': -6.6640625,
|
||||
'text': ' history',
|
||||
}),
|
||||
dict({
|
||||
'id': 3212,
|
||||
'logprob': -2.265625,
|
||||
'text': ' behind',
|
||||
}),
|
||||
dict({
|
||||
'id': 436,
|
||||
'logprob': -11.5078125,
|
||||
'text': ' this',
|
||||
}),
|
||||
dict({
|
||||
'id': 3159,
|
||||
'logprob': -2.1582031,
|
||||
'text': ' word',
|
||||
}),
|
||||
dict({
|
||||
'id': 32,
|
||||
'logprob': -0.008720398,
|
||||
'text': '?',
|
||||
}),
|
||||
dict({
|
||||
'id': 0,
|
||||
'logprob': -2.4726562,
|
||||
'text': '<|endoftext|>',
|
||||
}),
|
||||
dict({
|
||||
'id': 50281,
|
||||
'logprob': -18.265625,
|
||||
'text': '<|assistant|>',
|
||||
}),
|
||||
]),
|
||||
@ -101,61 +83,51 @@
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 510,
|
||||
'logprob': -0.63183594,
|
||||
'special': False,
|
||||
'text': 'The',
|
||||
}),
|
||||
dict({
|
||||
'id': 3159,
|
||||
'logprob': -0.5390625,
|
||||
'special': False,
|
||||
'text': ' word',
|
||||
}),
|
||||
dict({
|
||||
'id': 346,
|
||||
'logprob': -0.045684814,
|
||||
'special': False,
|
||||
'text': ' "',
|
||||
}),
|
||||
dict({
|
||||
'id': 6441,
|
||||
'logprob': -0.002090454,
|
||||
'special': False,
|
||||
'text': 'mem',
|
||||
}),
|
||||
dict({
|
||||
'id': 70,
|
||||
'logprob': -1.3589859e-05,
|
||||
'special': False,
|
||||
'text': 'e',
|
||||
}),
|
||||
dict({
|
||||
'id': 3,
|
||||
'logprob': -0.0009455681,
|
||||
'special': False,
|
||||
'text': '"',
|
||||
}),
|
||||
dict({
|
||||
'id': 369,
|
||||
'logprob': -0.088012695,
|
||||
'special': False,
|
||||
'text': ' was',
|
||||
}),
|
||||
dict({
|
||||
'id': 806,
|
||||
'logprob': -0.12585449,
|
||||
'special': False,
|
||||
'text': ' first',
|
||||
}),
|
||||
dict({
|
||||
'id': 908,
|
||||
'logprob': -0.017196655,
|
||||
'special': False,
|
||||
'text': ' used',
|
||||
}),
|
||||
dict({
|
||||
'id': 275,
|
||||
'logprob': -0.49731445,
|
||||
'special': False,
|
||||
'text': ' in',
|
||||
}),
|
||||
@ -166,9 +138,545 @@
|
||||
# ---
|
||||
# name: test_flash_neox_load
|
||||
list([
|
||||
'The word "meme" was first used in',
|
||||
'The word "meme" was first used in',
|
||||
'The word "meme" was first used in',
|
||||
'The word "meme" was first used in',
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 50278,
|
||||
'text': '<|prompter|>',
|
||||
}),
|
||||
dict({
|
||||
'id': 1276,
|
||||
'text': 'What',
|
||||
}),
|
||||
dict({
|
||||
'id': 310,
|
||||
'text': ' is',
|
||||
}),
|
||||
dict({
|
||||
'id': 247,
|
||||
'text': ' a',
|
||||
}),
|
||||
dict({
|
||||
'id': 1167,
|
||||
'text': ' mem',
|
||||
}),
|
||||
dict({
|
||||
'id': 70,
|
||||
'text': 'e',
|
||||
}),
|
||||
dict({
|
||||
'id': 13,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 285,
|
||||
'text': ' and',
|
||||
}),
|
||||
dict({
|
||||
'id': 752,
|
||||
'text': ' what',
|
||||
}),
|
||||
dict({
|
||||
'id': 434,
|
||||
'text': "'s",
|
||||
}),
|
||||
dict({
|
||||
'id': 253,
|
||||
'text': ' the',
|
||||
}),
|
||||
dict({
|
||||
'id': 2892,
|
||||
'text': ' history',
|
||||
}),
|
||||
dict({
|
||||
'id': 3212,
|
||||
'text': ' behind',
|
||||
}),
|
||||
dict({
|
||||
'id': 436,
|
||||
'text': ' this',
|
||||
}),
|
||||
dict({
|
||||
'id': 3159,
|
||||
'text': ' word',
|
||||
}),
|
||||
dict({
|
||||
'id': 32,
|
||||
'text': '?',
|
||||
}),
|
||||
dict({
|
||||
'id': 0,
|
||||
'text': '<|endoftext|>',
|
||||
}),
|
||||
dict({
|
||||
'id': 50281,
|
||||
'text': '<|assistant|>',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 510,
|
||||
'special': False,
|
||||
'text': 'The',
|
||||
}),
|
||||
dict({
|
||||
'id': 3159,
|
||||
'special': False,
|
||||
'text': ' word',
|
||||
}),
|
||||
dict({
|
||||
'id': 346,
|
||||
'special': False,
|
||||
'text': ' "',
|
||||
}),
|
||||
dict({
|
||||
'id': 6441,
|
||||
'special': False,
|
||||
'text': 'mem',
|
||||
}),
|
||||
dict({
|
||||
'id': 70,
|
||||
'special': False,
|
||||
'text': 'e',
|
||||
}),
|
||||
dict({
|
||||
'id': 3,
|
||||
'special': False,
|
||||
'text': '"',
|
||||
}),
|
||||
dict({
|
||||
'id': 369,
|
||||
'special': False,
|
||||
'text': ' was',
|
||||
}),
|
||||
dict({
|
||||
'id': 806,
|
||||
'special': False,
|
||||
'text': ' first',
|
||||
}),
|
||||
dict({
|
||||
'id': 908,
|
||||
'special': False,
|
||||
'text': ' used',
|
||||
}),
|
||||
dict({
|
||||
'id': 275,
|
||||
'special': False,
|
||||
'text': ' in',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'The word "meme" was first used in',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 50278,
|
||||
'text': '<|prompter|>',
|
||||
}),
|
||||
dict({
|
||||
'id': 1276,
|
||||
'text': 'What',
|
||||
}),
|
||||
dict({
|
||||
'id': 310,
|
||||
'text': ' is',
|
||||
}),
|
||||
dict({
|
||||
'id': 247,
|
||||
'text': ' a',
|
||||
}),
|
||||
dict({
|
||||
'id': 1167,
|
||||
'text': ' mem',
|
||||
}),
|
||||
dict({
|
||||
'id': 70,
|
||||
'text': 'e',
|
||||
}),
|
||||
dict({
|
||||
'id': 13,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 285,
|
||||
'text': ' and',
|
||||
}),
|
||||
dict({
|
||||
'id': 752,
|
||||
'text': ' what',
|
||||
}),
|
||||
dict({
|
||||
'id': 434,
|
||||
'text': "'s",
|
||||
}),
|
||||
dict({
|
||||
'id': 253,
|
||||
'text': ' the',
|
||||
}),
|
||||
dict({
|
||||
'id': 2892,
|
||||
'text': ' history',
|
||||
}),
|
||||
dict({
|
||||
'id': 3212,
|
||||
'text': ' behind',
|
||||
}),
|
||||
dict({
|
||||
'id': 436,
|
||||
'text': ' this',
|
||||
}),
|
||||
dict({
|
||||
'id': 3159,
|
||||
'text': ' word',
|
||||
}),
|
||||
dict({
|
||||
'id': 32,
|
||||
'text': '?',
|
||||
}),
|
||||
dict({
|
||||
'id': 0,
|
||||
'text': '<|endoftext|>',
|
||||
}),
|
||||
dict({
|
||||
'id': 50281,
|
||||
'text': '<|assistant|>',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 510,
|
||||
'special': False,
|
||||
'text': 'The',
|
||||
}),
|
||||
dict({
|
||||
'id': 3159,
|
||||
'special': False,
|
||||
'text': ' word',
|
||||
}),
|
||||
dict({
|
||||
'id': 346,
|
||||
'special': False,
|
||||
'text': ' "',
|
||||
}),
|
||||
dict({
|
||||
'id': 6441,
|
||||
'special': False,
|
||||
'text': 'mem',
|
||||
}),
|
||||
dict({
|
||||
'id': 70,
|
||||
'special': False,
|
||||
'text': 'e',
|
||||
}),
|
||||
dict({
|
||||
'id': 3,
|
||||
'special': False,
|
||||
'text': '"',
|
||||
}),
|
||||
dict({
|
||||
'id': 369,
|
||||
'special': False,
|
||||
'text': ' was',
|
||||
}),
|
||||
dict({
|
||||
'id': 806,
|
||||
'special': False,
|
||||
'text': ' first',
|
||||
}),
|
||||
dict({
|
||||
'id': 908,
|
||||
'special': False,
|
||||
'text': ' used',
|
||||
}),
|
||||
dict({
|
||||
'id': 275,
|
||||
'special': False,
|
||||
'text': ' in',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'The word "meme" was first used in',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 50278,
|
||||
'text': '<|prompter|>',
|
||||
}),
|
||||
dict({
|
||||
'id': 1276,
|
||||
'text': 'What',
|
||||
}),
|
||||
dict({
|
||||
'id': 310,
|
||||
'text': ' is',
|
||||
}),
|
||||
dict({
|
||||
'id': 247,
|
||||
'text': ' a',
|
||||
}),
|
||||
dict({
|
||||
'id': 1167,
|
||||
'text': ' mem',
|
||||
}),
|
||||
dict({
|
||||
'id': 70,
|
||||
'text': 'e',
|
||||
}),
|
||||
dict({
|
||||
'id': 13,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 285,
|
||||
'text': ' and',
|
||||
}),
|
||||
dict({
|
||||
'id': 752,
|
||||
'text': ' what',
|
||||
}),
|
||||
dict({
|
||||
'id': 434,
|
||||
'text': "'s",
|
||||
}),
|
||||
dict({
|
||||
'id': 253,
|
||||
'text': ' the',
|
||||
}),
|
||||
dict({
|
||||
'id': 2892,
|
||||
'text': ' history',
|
||||
}),
|
||||
dict({
|
||||
'id': 3212,
|
||||
'text': ' behind',
|
||||
}),
|
||||
dict({
|
||||
'id': 436,
|
||||
'text': ' this',
|
||||
}),
|
||||
dict({
|
||||
'id': 3159,
|
||||
'text': ' word',
|
||||
}),
|
||||
dict({
|
||||
'id': 32,
|
||||
'text': '?',
|
||||
}),
|
||||
dict({
|
||||
'id': 0,
|
||||
'text': '<|endoftext|>',
|
||||
}),
|
||||
dict({
|
||||
'id': 50281,
|
||||
'text': '<|assistant|>',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 510,
|
||||
'special': False,
|
||||
'text': 'The',
|
||||
}),
|
||||
dict({
|
||||
'id': 3159,
|
||||
'special': False,
|
||||
'text': ' word',
|
||||
}),
|
||||
dict({
|
||||
'id': 346,
|
||||
'special': False,
|
||||
'text': ' "',
|
||||
}),
|
||||
dict({
|
||||
'id': 6441,
|
||||
'special': False,
|
||||
'text': 'mem',
|
||||
}),
|
||||
dict({
|
||||
'id': 70,
|
||||
'special': False,
|
||||
'text': 'e',
|
||||
}),
|
||||
dict({
|
||||
'id': 3,
|
||||
'special': False,
|
||||
'text': '"',
|
||||
}),
|
||||
dict({
|
||||
'id': 369,
|
||||
'special': False,
|
||||
'text': ' was',
|
||||
}),
|
||||
dict({
|
||||
'id': 806,
|
||||
'special': False,
|
||||
'text': ' first',
|
||||
}),
|
||||
dict({
|
||||
'id': 908,
|
||||
'special': False,
|
||||
'text': ' used',
|
||||
}),
|
||||
dict({
|
||||
'id': 275,
|
||||
'special': False,
|
||||
'text': ' in',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'The word "meme" was first used in',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 50278,
|
||||
'text': '<|prompter|>',
|
||||
}),
|
||||
dict({
|
||||
'id': 1276,
|
||||
'text': 'What',
|
||||
}),
|
||||
dict({
|
||||
'id': 310,
|
||||
'text': ' is',
|
||||
}),
|
||||
dict({
|
||||
'id': 247,
|
||||
'text': ' a',
|
||||
}),
|
||||
dict({
|
||||
'id': 1167,
|
||||
'text': ' mem',
|
||||
}),
|
||||
dict({
|
||||
'id': 70,
|
||||
'text': 'e',
|
||||
}),
|
||||
dict({
|
||||
'id': 13,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 285,
|
||||
'text': ' and',
|
||||
}),
|
||||
dict({
|
||||
'id': 752,
|
||||
'text': ' what',
|
||||
}),
|
||||
dict({
|
||||
'id': 434,
|
||||
'text': "'s",
|
||||
}),
|
||||
dict({
|
||||
'id': 253,
|
||||
'text': ' the',
|
||||
}),
|
||||
dict({
|
||||
'id': 2892,
|
||||
'text': ' history',
|
||||
}),
|
||||
dict({
|
||||
'id': 3212,
|
||||
'text': ' behind',
|
||||
}),
|
||||
dict({
|
||||
'id': 436,
|
||||
'text': ' this',
|
||||
}),
|
||||
dict({
|
||||
'id': 3159,
|
||||
'text': ' word',
|
||||
}),
|
||||
dict({
|
||||
'id': 32,
|
||||
'text': '?',
|
||||
}),
|
||||
dict({
|
||||
'id': 0,
|
||||
'text': '<|endoftext|>',
|
||||
}),
|
||||
dict({
|
||||
'id': 50281,
|
||||
'text': '<|assistant|>',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 510,
|
||||
'special': False,
|
||||
'text': 'The',
|
||||
}),
|
||||
dict({
|
||||
'id': 3159,
|
||||
'special': False,
|
||||
'text': ' word',
|
||||
}),
|
||||
dict({
|
||||
'id': 346,
|
||||
'special': False,
|
||||
'text': ' "',
|
||||
}),
|
||||
dict({
|
||||
'id': 6441,
|
||||
'special': False,
|
||||
'text': 'mem',
|
||||
}),
|
||||
dict({
|
||||
'id': 70,
|
||||
'special': False,
|
||||
'text': 'e',
|
||||
}),
|
||||
dict({
|
||||
'id': 3,
|
||||
'special': False,
|
||||
'text': '"',
|
||||
}),
|
||||
dict({
|
||||
'id': 369,
|
||||
'special': False,
|
||||
'text': ' was',
|
||||
}),
|
||||
dict({
|
||||
'id': 806,
|
||||
'special': False,
|
||||
'text': ' first',
|
||||
}),
|
||||
dict({
|
||||
'id': 908,
|
||||
'special': False,
|
||||
'text': ' used',
|
||||
}),
|
||||
dict({
|
||||
'id': 275,
|
||||
'special': False,
|
||||
'text': ' in',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'The word "meme" was first used in',
|
||||
}),
|
||||
])
|
||||
# ---
|
||||
|
@ -8,22 +8,18 @@
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 563,
|
||||
'logprob': None,
|
||||
'text': 'def',
|
||||
}),
|
||||
dict({
|
||||
'id': 942,
|
||||
'logprob': -5.1367188,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 62,
|
||||
'logprob': -0.24450684,
|
||||
'text': '_',
|
||||
}),
|
||||
dict({
|
||||
'id': 7196,
|
||||
'logprob': -6.9609375,
|
||||
'text': 'hello',
|
||||
}),
|
||||
]),
|
||||
@ -31,13 +27,11 @@
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 1241,
|
||||
'logprob': -0.9863281,
|
||||
'special': False,
|
||||
'text': '():',
|
||||
}),
|
||||
dict({
|
||||
'id': 258,
|
||||
'logprob': -0.21447754,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
@ -46,37 +40,31 @@
|
||||
}),
|
||||
dict({
|
||||
'id': 942,
|
||||
'logprob': -0.43701172,
|
||||
'special': False,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 372,
|
||||
'logprob': -0.5361328,
|
||||
'special': False,
|
||||
'text': '("',
|
||||
}),
|
||||
dict({
|
||||
'id': 7371,
|
||||
'logprob': -0.44555664,
|
||||
'special': False,
|
||||
'text': 'Hello',
|
||||
}),
|
||||
dict({
|
||||
'id': 9956,
|
||||
'logprob': -1.2412109,
|
||||
'special': False,
|
||||
'text': ' World',
|
||||
}),
|
||||
dict({
|
||||
'id': 8657,
|
||||
'logprob': -0.7583008,
|
||||
'special': False,
|
||||
'text': '!")',
|
||||
}),
|
||||
dict({
|
||||
'id': 185,
|
||||
'logprob': -0.76171875,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
@ -85,7 +73,6 @@
|
||||
}),
|
||||
dict({
|
||||
'id': 185,
|
||||
'logprob': -0.20837402,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
@ -94,7 +81,6 @@
|
||||
}),
|
||||
dict({
|
||||
'id': 1018,
|
||||
'logprob': -1.2470703,
|
||||
'special': False,
|
||||
'text': 'print',
|
||||
}),
|
||||
@ -110,29 +96,377 @@
|
||||
# ---
|
||||
# name: test_flash_santacoder_load
|
||||
list([
|
||||
'''
|
||||
():
|
||||
print("Hello World!")
|
||||
|
||||
print
|
||||
''',
|
||||
'''
|
||||
():
|
||||
print("Hello World!")
|
||||
|
||||
print
|
||||
''',
|
||||
'''
|
||||
():
|
||||
print("Hello World!")
|
||||
|
||||
print
|
||||
''',
|
||||
'''
|
||||
():
|
||||
print("Hello World!")
|
||||
|
||||
print
|
||||
''',
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 563,
|
||||
'text': 'def',
|
||||
}),
|
||||
dict({
|
||||
'id': 942,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 62,
|
||||
'text': '_',
|
||||
}),
|
||||
dict({
|
||||
'id': 7196,
|
||||
'text': 'hello',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 1241,
|
||||
'special': False,
|
||||
'text': '():',
|
||||
}),
|
||||
dict({
|
||||
'id': 258,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 942,
|
||||
'special': False,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 372,
|
||||
'special': False,
|
||||
'text': '("',
|
||||
}),
|
||||
dict({
|
||||
'id': 7371,
|
||||
'special': False,
|
||||
'text': 'Hello',
|
||||
}),
|
||||
dict({
|
||||
'id': 9956,
|
||||
'special': False,
|
||||
'text': ' World',
|
||||
}),
|
||||
dict({
|
||||
'id': 8657,
|
||||
'special': False,
|
||||
'text': '!")',
|
||||
}),
|
||||
dict({
|
||||
'id': 185,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 185,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 1018,
|
||||
'special': False,
|
||||
'text': 'print',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': '''
|
||||
():
|
||||
print("Hello World!")
|
||||
|
||||
print
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 563,
|
||||
'text': 'def',
|
||||
}),
|
||||
dict({
|
||||
'id': 942,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 62,
|
||||
'text': '_',
|
||||
}),
|
||||
dict({
|
||||
'id': 7196,
|
||||
'text': 'hello',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 1241,
|
||||
'special': False,
|
||||
'text': '():',
|
||||
}),
|
||||
dict({
|
||||
'id': 258,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 942,
|
||||
'special': False,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 372,
|
||||
'special': False,
|
||||
'text': '("',
|
||||
}),
|
||||
dict({
|
||||
'id': 7371,
|
||||
'special': False,
|
||||
'text': 'Hello',
|
||||
}),
|
||||
dict({
|
||||
'id': 9956,
|
||||
'special': False,
|
||||
'text': ' World',
|
||||
}),
|
||||
dict({
|
||||
'id': 8657,
|
||||
'special': False,
|
||||
'text': '!")',
|
||||
}),
|
||||
dict({
|
||||
'id': 185,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 185,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 1018,
|
||||
'special': False,
|
||||
'text': 'print',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': '''
|
||||
():
|
||||
print("Hello World!")
|
||||
|
||||
print
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 563,
|
||||
'text': 'def',
|
||||
}),
|
||||
dict({
|
||||
'id': 942,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 62,
|
||||
'text': '_',
|
||||
}),
|
||||
dict({
|
||||
'id': 7196,
|
||||
'text': 'hello',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 1241,
|
||||
'special': False,
|
||||
'text': '():',
|
||||
}),
|
||||
dict({
|
||||
'id': 258,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 942,
|
||||
'special': False,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 372,
|
||||
'special': False,
|
||||
'text': '("',
|
||||
}),
|
||||
dict({
|
||||
'id': 7371,
|
||||
'special': False,
|
||||
'text': 'Hello',
|
||||
}),
|
||||
dict({
|
||||
'id': 9956,
|
||||
'special': False,
|
||||
'text': ' World',
|
||||
}),
|
||||
dict({
|
||||
'id': 8657,
|
||||
'special': False,
|
||||
'text': '!")',
|
||||
}),
|
||||
dict({
|
||||
'id': 185,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 185,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 1018,
|
||||
'special': False,
|
||||
'text': 'print',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': '''
|
||||
():
|
||||
print("Hello World!")
|
||||
|
||||
print
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 563,
|
||||
'text': 'def',
|
||||
}),
|
||||
dict({
|
||||
'id': 942,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 62,
|
||||
'text': '_',
|
||||
}),
|
||||
dict({
|
||||
'id': 7196,
|
||||
'text': 'hello',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 1241,
|
||||
'special': False,
|
||||
'text': '():',
|
||||
}),
|
||||
dict({
|
||||
'id': 258,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 942,
|
||||
'special': False,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 372,
|
||||
'special': False,
|
||||
'text': '("',
|
||||
}),
|
||||
dict({
|
||||
'id': 7371,
|
||||
'special': False,
|
||||
'text': 'Hello',
|
||||
}),
|
||||
dict({
|
||||
'id': 9956,
|
||||
'special': False,
|
||||
'text': ' World',
|
||||
}),
|
||||
dict({
|
||||
'id': 8657,
|
||||
'special': False,
|
||||
'text': '!")',
|
||||
}),
|
||||
dict({
|
||||
'id': 185,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 185,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 1018,
|
||||
'special': False,
|
||||
'text': 'print',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': '''
|
||||
():
|
||||
print("Hello World!")
|
||||
|
||||
print
|
||||
''',
|
||||
}),
|
||||
])
|
||||
# ---
|
||||
|
@ -8,22 +8,18 @@
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 589,
|
||||
'logprob': None,
|
||||
'text': 'def',
|
||||
}),
|
||||
dict({
|
||||
'id': 1459,
|
||||
'logprob': -5.6289062,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 81,
|
||||
'logprob': -1.6005859,
|
||||
'text': '_',
|
||||
}),
|
||||
dict({
|
||||
'id': 7656,
|
||||
'logprob': -5.9921875,
|
||||
'text': 'hello',
|
||||
}),
|
||||
]),
|
||||
@ -31,13 +27,11 @@
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 2262,
|
||||
'logprob': -0.7705078,
|
||||
'special': False,
|
||||
'text': '():',
|
||||
}),
|
||||
dict({
|
||||
'id': 284,
|
||||
'logprob': -0.2590332,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
@ -46,37 +40,31 @@
|
||||
}),
|
||||
dict({
|
||||
'id': 1459,
|
||||
'logprob': -0.39379883,
|
||||
'special': False,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 440,
|
||||
'logprob': -0.61376953,
|
||||
'special': False,
|
||||
'text': '("',
|
||||
}),
|
||||
dict({
|
||||
'id': 8279,
|
||||
'logprob': -0.47338867,
|
||||
'special': False,
|
||||
'text': 'Hello',
|
||||
}),
|
||||
dict({
|
||||
'id': 10896,
|
||||
'logprob': -1.5068359,
|
||||
'special': False,
|
||||
'text': ' World',
|
||||
}),
|
||||
dict({
|
||||
'id': 657,
|
||||
'logprob': -0.80810547,
|
||||
'special': False,
|
||||
'text': '")',
|
||||
}),
|
||||
dict({
|
||||
'id': 203,
|
||||
'logprob': -0.7397461,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
@ -85,7 +73,6 @@
|
||||
}),
|
||||
dict({
|
||||
'id': 203,
|
||||
'logprob': -0.35229492,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
@ -94,7 +81,6 @@
|
||||
}),
|
||||
dict({
|
||||
'id': 589,
|
||||
'logprob': -1.0371094,
|
||||
'special': False,
|
||||
'text': 'def',
|
||||
}),
|
||||
@ -117,22 +103,18 @@
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 589,
|
||||
'logprob': None,
|
||||
'text': 'def',
|
||||
}),
|
||||
dict({
|
||||
'id': 1459,
|
||||
'logprob': -5.6289062,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 81,
|
||||
'logprob': -1.6005859,
|
||||
'text': '_',
|
||||
}),
|
||||
dict({
|
||||
'id': 7656,
|
||||
'logprob': -5.9921875,
|
||||
'text': 'hello',
|
||||
}),
|
||||
]),
|
||||
@ -140,13 +122,11 @@
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 2262,
|
||||
'logprob': -0.7451172,
|
||||
'special': False,
|
||||
'text': '():',
|
||||
}),
|
||||
dict({
|
||||
'id': 284,
|
||||
'logprob': -0.21325684,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
@ -155,55 +135,46 @@
|
||||
}),
|
||||
dict({
|
||||
'id': 5741,
|
||||
'logprob': -5.734375,
|
||||
'special': False,
|
||||
'text': ' logging',
|
||||
}),
|
||||
dict({
|
||||
'id': 32,
|
||||
'logprob': 0.0,
|
||||
'special': False,
|
||||
'text': '.',
|
||||
}),
|
||||
dict({
|
||||
'id': 1338,
|
||||
'logprob': -0.3232422,
|
||||
'special': False,
|
||||
'text': 'info',
|
||||
}),
|
||||
dict({
|
||||
'id': 463,
|
||||
'logprob': -1.0380859,
|
||||
'special': False,
|
||||
'text': "('",
|
||||
}),
|
||||
dict({
|
||||
'id': 8279,
|
||||
'logprob': -0.8378906,
|
||||
'special': False,
|
||||
'text': 'Hello',
|
||||
}),
|
||||
dict({
|
||||
'id': 30,
|
||||
'logprob': -1.9501953,
|
||||
'special': False,
|
||||
'text': ',',
|
||||
}),
|
||||
dict({
|
||||
'id': 10896,
|
||||
'logprob': -1.3476562,
|
||||
'special': False,
|
||||
'text': ' World',
|
||||
}),
|
||||
dict({
|
||||
'id': 683,
|
||||
'logprob': -1.796875,
|
||||
'special': False,
|
||||
'text': "')",
|
||||
}),
|
||||
dict({
|
||||
'id': 203,
|
||||
'logprob': -0.9873047,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
@ -212,7 +183,6 @@
|
||||
}),
|
||||
dict({
|
||||
'id': 0,
|
||||
'logprob': -0.7495117,
|
||||
'special': True,
|
||||
'text': '<|endoftext|>',
|
||||
}),
|
||||
@ -227,29 +197,377 @@
|
||||
# ---
|
||||
# name: test_flash_starcoder_load
|
||||
list([
|
||||
'''
|
||||
():
|
||||
print("Hello World")
|
||||
|
||||
def
|
||||
''',
|
||||
'''
|
||||
():
|
||||
print("Hello World")
|
||||
|
||||
def
|
||||
''',
|
||||
'''
|
||||
():
|
||||
print("Hello World")
|
||||
|
||||
def
|
||||
''',
|
||||
'''
|
||||
():
|
||||
print("Hello World")
|
||||
|
||||
def
|
||||
''',
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 589,
|
||||
'text': 'def',
|
||||
}),
|
||||
dict({
|
||||
'id': 1459,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 81,
|
||||
'text': '_',
|
||||
}),
|
||||
dict({
|
||||
'id': 7656,
|
||||
'text': 'hello',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 2262,
|
||||
'special': False,
|
||||
'text': '():',
|
||||
}),
|
||||
dict({
|
||||
'id': 284,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 1459,
|
||||
'special': False,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 440,
|
||||
'special': False,
|
||||
'text': '("',
|
||||
}),
|
||||
dict({
|
||||
'id': 8279,
|
||||
'special': False,
|
||||
'text': 'Hello',
|
||||
}),
|
||||
dict({
|
||||
'id': 10896,
|
||||
'special': False,
|
||||
'text': ' World',
|
||||
}),
|
||||
dict({
|
||||
'id': 657,
|
||||
'special': False,
|
||||
'text': '")',
|
||||
}),
|
||||
dict({
|
||||
'id': 203,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 203,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 589,
|
||||
'special': False,
|
||||
'text': 'def',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': '''
|
||||
():
|
||||
print("Hello World")
|
||||
|
||||
def
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 589,
|
||||
'text': 'def',
|
||||
}),
|
||||
dict({
|
||||
'id': 1459,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 81,
|
||||
'text': '_',
|
||||
}),
|
||||
dict({
|
||||
'id': 7656,
|
||||
'text': 'hello',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 2262,
|
||||
'special': False,
|
||||
'text': '():',
|
||||
}),
|
||||
dict({
|
||||
'id': 284,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 1459,
|
||||
'special': False,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 440,
|
||||
'special': False,
|
||||
'text': '("',
|
||||
}),
|
||||
dict({
|
||||
'id': 8279,
|
||||
'special': False,
|
||||
'text': 'Hello',
|
||||
}),
|
||||
dict({
|
||||
'id': 10896,
|
||||
'special': False,
|
||||
'text': ' World',
|
||||
}),
|
||||
dict({
|
||||
'id': 657,
|
||||
'special': False,
|
||||
'text': '")',
|
||||
}),
|
||||
dict({
|
||||
'id': 203,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 203,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 589,
|
||||
'special': False,
|
||||
'text': 'def',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': '''
|
||||
():
|
||||
print("Hello World")
|
||||
|
||||
def
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 589,
|
||||
'text': 'def',
|
||||
}),
|
||||
dict({
|
||||
'id': 1459,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 81,
|
||||
'text': '_',
|
||||
}),
|
||||
dict({
|
||||
'id': 7656,
|
||||
'text': 'hello',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 2262,
|
||||
'special': False,
|
||||
'text': '():',
|
||||
}),
|
||||
dict({
|
||||
'id': 284,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 1459,
|
||||
'special': False,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 440,
|
||||
'special': False,
|
||||
'text': '("',
|
||||
}),
|
||||
dict({
|
||||
'id': 8279,
|
||||
'special': False,
|
||||
'text': 'Hello',
|
||||
}),
|
||||
dict({
|
||||
'id': 10896,
|
||||
'special': False,
|
||||
'text': ' World',
|
||||
}),
|
||||
dict({
|
||||
'id': 657,
|
||||
'special': False,
|
||||
'text': '")',
|
||||
}),
|
||||
dict({
|
||||
'id': 203,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 203,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 589,
|
||||
'special': False,
|
||||
'text': 'def',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': '''
|
||||
():
|
||||
print("Hello World")
|
||||
|
||||
def
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.Length: 'length'>,
|
||||
'generated_tokens': 10,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 589,
|
||||
'text': 'def',
|
||||
}),
|
||||
dict({
|
||||
'id': 1459,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 81,
|
||||
'text': '_',
|
||||
}),
|
||||
dict({
|
||||
'id': 7656,
|
||||
'text': 'hello',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 2262,
|
||||
'special': False,
|
||||
'text': '():',
|
||||
}),
|
||||
dict({
|
||||
'id': 284,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 1459,
|
||||
'special': False,
|
||||
'text': ' print',
|
||||
}),
|
||||
dict({
|
||||
'id': 440,
|
||||
'special': False,
|
||||
'text': '("',
|
||||
}),
|
||||
dict({
|
||||
'id': 8279,
|
||||
'special': False,
|
||||
'text': 'Hello',
|
||||
}),
|
||||
dict({
|
||||
'id': 10896,
|
||||
'special': False,
|
||||
'text': ' World',
|
||||
}),
|
||||
dict({
|
||||
'id': 657,
|
||||
'special': False,
|
||||
'text': '")',
|
||||
}),
|
||||
dict({
|
||||
'id': 203,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 203,
|
||||
'special': False,
|
||||
'text': '''
|
||||
|
||||
|
||||
''',
|
||||
}),
|
||||
dict({
|
||||
'id': 589,
|
||||
'special': False,
|
||||
'text': 'def',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': '''
|
||||
():
|
||||
print("Hello World")
|
||||
|
||||
def
|
||||
''',
|
||||
}),
|
||||
])
|
||||
# ---
|
||||
|
@ -8,7 +8,6 @@
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 0,
|
||||
'logprob': None,
|
||||
'text': '<pad>',
|
||||
}),
|
||||
]),
|
||||
@ -16,31 +15,26 @@
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 926,
|
||||
'logprob': -4.3554688,
|
||||
'special': False,
|
||||
'text': 'To',
|
||||
}),
|
||||
dict({
|
||||
'id': 18295,
|
||||
'logprob': -7.7734375,
|
||||
'special': False,
|
||||
'text': ' sell',
|
||||
}),
|
||||
dict({
|
||||
'id': 7868,
|
||||
'logprob': -3.9257812,
|
||||
'special': False,
|
||||
'text': ' things',
|
||||
}),
|
||||
dict({
|
||||
'id': 260,
|
||||
'logprob': -2.4179688,
|
||||
'special': False,
|
||||
'text': '.',
|
||||
}),
|
||||
dict({
|
||||
'id': 1,
|
||||
'logprob': 0.0,
|
||||
'special': True,
|
||||
'text': '</s>',
|
||||
}),
|
||||
@ -58,7 +52,6 @@
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 0,
|
||||
'logprob': None,
|
||||
'text': '<pad>',
|
||||
}),
|
||||
]),
|
||||
@ -66,61 +59,51 @@
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 16017,
|
||||
'logprob': -1.3505859,
|
||||
'special': False,
|
||||
'text': 'blue',
|
||||
}),
|
||||
dict({
|
||||
'id': 20495,
|
||||
'logprob': -0.50439453,
|
||||
'special': False,
|
||||
'text': ' sky',
|
||||
}),
|
||||
dict({
|
||||
'id': 259,
|
||||
'logprob': -1.2011719,
|
||||
'special': False,
|
||||
'text': ' ',
|
||||
}),
|
||||
dict({
|
||||
'id': 15484,
|
||||
'logprob': -2.8378906,
|
||||
'special': False,
|
||||
'text': 'appear',
|
||||
}),
|
||||
dict({
|
||||
'id': 345,
|
||||
'logprob': -0.87597656,
|
||||
'special': False,
|
||||
'text': 'ed',
|
||||
}),
|
||||
dict({
|
||||
'id': 288,
|
||||
'logprob': -1.8447266,
|
||||
'special': False,
|
||||
'text': ' to',
|
||||
}),
|
||||
dict({
|
||||
'id': 35622,
|
||||
'logprob': -7.1445312,
|
||||
'special': False,
|
||||
'text': ' cloud',
|
||||
}),
|
||||
dict({
|
||||
'id': 263,
|
||||
'logprob': -1.2929688,
|
||||
'special': False,
|
||||
'text': 's',
|
||||
}),
|
||||
dict({
|
||||
'id': 14701,
|
||||
'logprob': -3.0761719,
|
||||
'special': False,
|
||||
'text': ' above',
|
||||
}),
|
||||
dict({
|
||||
'id': 751,
|
||||
'logprob': -4.4375,
|
||||
'special': False,
|
||||
'text': ' all',
|
||||
}),
|
||||
@ -131,9 +114,193 @@
|
||||
# ---
|
||||
# name: test_mt0_base_load
|
||||
list([
|
||||
'Because it is blue',
|
||||
'Because it is blue',
|
||||
'Because it is blue',
|
||||
'Because it is blue',
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.EndOfSequenceToken: 'eos_token'>,
|
||||
'generated_tokens': 6,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 0,
|
||||
'text': '<pad>',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 259,
|
||||
'special': False,
|
||||
'text': '',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'special': False,
|
||||
'text': 'Because',
|
||||
}),
|
||||
dict({
|
||||
'id': 609,
|
||||
'special': False,
|
||||
'text': ' it',
|
||||
}),
|
||||
dict({
|
||||
'id': 339,
|
||||
'special': False,
|
||||
'text': ' is',
|
||||
}),
|
||||
dict({
|
||||
'id': 16017,
|
||||
'special': False,
|
||||
'text': ' blue',
|
||||
}),
|
||||
dict({
|
||||
'id': 1,
|
||||
'special': True,
|
||||
'text': '</s>',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'Because it is blue',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.EndOfSequenceToken: 'eos_token'>,
|
||||
'generated_tokens': 6,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 0,
|
||||
'text': '<pad>',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 259,
|
||||
'special': False,
|
||||
'text': '',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'special': False,
|
||||
'text': 'Because',
|
||||
}),
|
||||
dict({
|
||||
'id': 609,
|
||||
'special': False,
|
||||
'text': ' it',
|
||||
}),
|
||||
dict({
|
||||
'id': 339,
|
||||
'special': False,
|
||||
'text': ' is',
|
||||
}),
|
||||
dict({
|
||||
'id': 16017,
|
||||
'special': False,
|
||||
'text': ' blue',
|
||||
}),
|
||||
dict({
|
||||
'id': 1,
|
||||
'special': True,
|
||||
'text': '</s>',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'Because it is blue',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.EndOfSequenceToken: 'eos_token'>,
|
||||
'generated_tokens': 6,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 0,
|
||||
'text': '<pad>',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 259,
|
||||
'special': False,
|
||||
'text': '',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'special': False,
|
||||
'text': 'Because',
|
||||
}),
|
||||
dict({
|
||||
'id': 609,
|
||||
'special': False,
|
||||
'text': ' it',
|
||||
}),
|
||||
dict({
|
||||
'id': 339,
|
||||
'special': False,
|
||||
'text': ' is',
|
||||
}),
|
||||
dict({
|
||||
'id': 16017,
|
||||
'special': False,
|
||||
'text': ' blue',
|
||||
}),
|
||||
dict({
|
||||
'id': 1,
|
||||
'special': True,
|
||||
'text': '</s>',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'Because it is blue',
|
||||
}),
|
||||
dict({
|
||||
'details': dict({
|
||||
'best_of_sequences': None,
|
||||
'finish_reason': <FinishReason.EndOfSequenceToken: 'eos_token'>,
|
||||
'generated_tokens': 6,
|
||||
'prefill': list([
|
||||
dict({
|
||||
'id': 0,
|
||||
'text': '<pad>',
|
||||
}),
|
||||
]),
|
||||
'seed': None,
|
||||
'tokens': list([
|
||||
dict({
|
||||
'id': 259,
|
||||
'special': False,
|
||||
'text': '',
|
||||
}),
|
||||
dict({
|
||||
'id': 39261,
|
||||
'special': False,
|
||||
'text': 'Because',
|
||||
}),
|
||||
dict({
|
||||
'id': 609,
|
||||
'special': False,
|
||||
'text': ' it',
|
||||
}),
|
||||
dict({
|
||||
'id': 339,
|
||||
'special': False,
|
||||
'text': ' is',
|
||||
}),
|
||||
dict({
|
||||
'id': 16017,
|
||||
'special': False,
|
||||
'text': ' blue',
|
||||
}),
|
||||
dict({
|
||||
'id': 1,
|
||||
'special': True,
|
||||
'text': '</s>',
|
||||
}),
|
||||
]),
|
||||
}),
|
||||
'generated_text': 'Because it is blue',
|
||||
}),
|
||||
])
|
||||
# ---
|
||||
|
@ -10,7 +10,7 @@ def bloom_560(launcher):
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_bloom_560m(bloom_560, snapshot):
|
||||
async def test_bloom_560m(bloom_560, snapshot_test):
|
||||
await health_check(bloom_560, 60)
|
||||
|
||||
response = await bloom_560.generate(
|
||||
@ -21,11 +21,11 @@ async def test_bloom_560m(bloom_560, snapshot):
|
||||
)
|
||||
|
||||
assert response.details.generated_tokens == 10
|
||||
assert response == snapshot
|
||||
assert snapshot_test(response)
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_bloom_560m_all_params(bloom_560, snapshot):
|
||||
async def test_bloom_560m_all_params(bloom_560, snapshot_test):
|
||||
await health_check(bloom_560, 60)
|
||||
|
||||
response = await bloom_560.generate(
|
||||
@ -44,11 +44,11 @@ async def test_bloom_560m_all_params(bloom_560, snapshot):
|
||||
)
|
||||
|
||||
assert response.details.generated_tokens == 10
|
||||
assert response == snapshot
|
||||
assert snapshot_test(response)
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_bloom_560m_load(bloom_560, generate_load, snapshot):
|
||||
async def test_bloom_560m_load(bloom_560, generate_load, snapshot_test):
|
||||
await health_check(bloom_560, 60)
|
||||
|
||||
responses = await generate_load(
|
||||
@ -60,4 +60,4 @@ async def test_bloom_560m_load(bloom_560, generate_load, snapshot):
|
||||
|
||||
assert len(responses) == 4
|
||||
|
||||
assert responses == snapshot
|
||||
assert snapshot_test(responses)
|
||||
|
@ -10,7 +10,7 @@ def bloom_560m_sharded(launcher):
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_bloom_560m_sharded(bloom_560m_sharded, snapshot):
|
||||
async def test_bloom_560m_sharded(bloom_560m_sharded, snapshot_test):
|
||||
await health_check(bloom_560m_sharded, 60)
|
||||
|
||||
response = await bloom_560m_sharded.generate(
|
||||
@ -21,11 +21,13 @@ async def test_bloom_560m_sharded(bloom_560m_sharded, snapshot):
|
||||
)
|
||||
|
||||
assert response.details.generated_tokens == 10
|
||||
assert response == snapshot
|
||||
assert snapshot_test(response)
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_bloom_560m_sharded_load(bloom_560m_sharded, generate_load, snapshot):
|
||||
async def test_bloom_560m_sharded_load(
|
||||
bloom_560m_sharded, generate_load, snapshot_test
|
||||
):
|
||||
await health_check(bloom_560m_sharded, 60)
|
||||
|
||||
responses = await generate_load(
|
||||
@ -37,4 +39,4 @@ async def test_bloom_560m_sharded_load(bloom_560m_sharded, generate_load, snapsh
|
||||
|
||||
assert len(responses) == 4
|
||||
|
||||
assert responses == snapshot
|
||||
assert snapshot_test(responses)
|
||||
|
@ -11,18 +11,18 @@ def flash_llama(launcher):
|
||||
|
||||
@pytest.mark.asyncio
|
||||
@pytest.mark.private
|
||||
async def test_flash_llama(flash_llama, snapshot):
|
||||
async def test_flash_llama(flash_llama, snapshot_test):
|
||||
await health_check(flash_llama, 120)
|
||||
|
||||
response = await flash_llama.generate("Test request", max_new_tokens=10)
|
||||
|
||||
assert response.details.generated_tokens == 10
|
||||
assert response == snapshot
|
||||
assert snapshot_test(response)
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
@pytest.mark.private
|
||||
async def test_flash_llama_all_params(flash_llama, snapshot):
|
||||
async def test_flash_llama_all_params(flash_llama, snapshot_test):
|
||||
await health_check(flash_llama, 120)
|
||||
|
||||
response = await flash_llama.generate(
|
||||
@ -41,16 +41,16 @@ async def test_flash_llama_all_params(flash_llama, snapshot):
|
||||
)
|
||||
|
||||
assert response.details.generated_tokens == 10
|
||||
assert response == snapshot
|
||||
assert snapshot_test(response)
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
@pytest.mark.private
|
||||
async def test_flash_llama_load(flash_llama, generate_load, snapshot):
|
||||
async def test_flash_llama_load(flash_llama, generate_load, snapshot_test):
|
||||
await health_check(flash_llama, 120)
|
||||
|
||||
responses = await generate_load(flash_llama, "Test request", max_new_tokens=10, n=4)
|
||||
|
||||
assert len(responses) == 4
|
||||
|
||||
assert responses == snapshot
|
||||
assert snapshot_test(responses)
|
||||
|
@ -10,7 +10,7 @@ def flash_neox(launcher):
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_flash_neox(flash_neox, snapshot):
|
||||
async def test_flash_neox(flash_neox, snapshot_test):
|
||||
await health_check(flash_neox, 240)
|
||||
|
||||
response = await flash_neox.generate(
|
||||
@ -19,11 +19,11 @@ async def test_flash_neox(flash_neox, snapshot):
|
||||
)
|
||||
|
||||
assert response.details.generated_tokens == 10
|
||||
assert response == snapshot
|
||||
assert snapshot_test(response)
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_flash_neox_load(flash_neox, generate_load, snapshot):
|
||||
async def test_flash_neox_load(flash_neox, generate_load, snapshot_test):
|
||||
await health_check(flash_neox, 240)
|
||||
|
||||
responses = await generate_load(
|
||||
@ -35,4 +35,4 @@ async def test_flash_neox_load(flash_neox, generate_load, snapshot):
|
||||
|
||||
assert len(responses) == 4
|
||||
|
||||
assert responses == snapshot
|
||||
assert snapshot_test(responses)
|
||||
|
@ -10,17 +10,17 @@ def flash_santacoder(launcher):
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_flash_santacoder(flash_santacoder, snapshot):
|
||||
async def test_flash_santacoder(flash_santacoder, snapshot_test):
|
||||
await health_check(flash_santacoder, 60)
|
||||
|
||||
response = await flash_santacoder.generate("def print_hello", max_new_tokens=10)
|
||||
|
||||
assert response.details.generated_tokens == 10
|
||||
assert response == snapshot
|
||||
assert snapshot_test(response)
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_flash_santacoder_load(flash_santacoder, generate_load, snapshot):
|
||||
async def test_flash_santacoder_load(flash_santacoder, generate_load, snapshot_test):
|
||||
await health_check(flash_santacoder, 60)
|
||||
|
||||
responses = await generate_load(
|
||||
@ -29,4 +29,4 @@ async def test_flash_santacoder_load(flash_santacoder, generate_load, snapshot):
|
||||
|
||||
assert len(responses) == 4
|
||||
|
||||
assert responses == snapshot
|
||||
assert snapshot_test(responses)
|
||||
|
@ -11,18 +11,18 @@ def flash_starcoder(launcher):
|
||||
|
||||
@pytest.mark.asyncio
|
||||
@pytest.mark.private
|
||||
async def test_flash_starcoder(flash_starcoder, snapshot):
|
||||
async def test_flash_starcoder(flash_starcoder, snapshot_test):
|
||||
await health_check(flash_starcoder, 240)
|
||||
|
||||
response = await flash_starcoder.generate("def print_hello", max_new_tokens=10)
|
||||
|
||||
assert response.details.generated_tokens == 10
|
||||
assert response == snapshot
|
||||
assert snapshot_test(response)
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
@pytest.mark.private
|
||||
async def test_flash_starcoder_default_params(flash_starcoder, snapshot):
|
||||
async def test_flash_starcoder_default_params(flash_starcoder, snapshot_test):
|
||||
await health_check(flash_starcoder, 240)
|
||||
|
||||
response = await flash_starcoder.generate(
|
||||
@ -30,12 +30,12 @@ async def test_flash_starcoder_default_params(flash_starcoder, snapshot):
|
||||
)
|
||||
|
||||
assert response.details.generated_tokens == 12
|
||||
assert response == snapshot
|
||||
assert snapshot_test(response)
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
@pytest.mark.private
|
||||
async def test_flash_starcoder_load(flash_starcoder, generate_load, snapshot):
|
||||
async def test_flash_starcoder_load(flash_starcoder, generate_load, snapshot_test):
|
||||
await health_check(flash_starcoder, 240)
|
||||
|
||||
responses = await generate_load(
|
||||
@ -44,4 +44,4 @@ async def test_flash_starcoder_load(flash_starcoder, generate_load, snapshot):
|
||||
|
||||
assert len(responses) == 4
|
||||
|
||||
assert responses == snapshot
|
||||
assert snapshot_test(responses)
|
||||
|
@ -10,7 +10,7 @@ def mt0_base(launcher):
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_mt0_base(mt0_base, snapshot):
|
||||
async def test_mt0_base(mt0_base, snapshot_test):
|
||||
await health_check(mt0_base, 60)
|
||||
|
||||
response = await mt0_base.generate(
|
||||
@ -21,11 +21,11 @@ async def test_mt0_base(mt0_base, snapshot):
|
||||
)
|
||||
|
||||
assert response.details.generated_tokens == 5
|
||||
assert response == snapshot
|
||||
assert snapshot_test(response)
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_mt0_base_all_params(mt0_base, snapshot):
|
||||
async def test_mt0_base_all_params(mt0_base, snapshot_test):
|
||||
await health_check(mt0_base, 60)
|
||||
|
||||
response = await mt0_base.generate(
|
||||
@ -44,11 +44,11 @@ async def test_mt0_base_all_params(mt0_base, snapshot):
|
||||
)
|
||||
|
||||
assert response.details.generated_tokens == 10
|
||||
assert response == snapshot
|
||||
assert snapshot_test(response)
|
||||
|
||||
|
||||
@pytest.mark.asyncio
|
||||
async def test_mt0_base_load(mt0_base, generate_load, snapshot):
|
||||
async def test_mt0_base_load(mt0_base, generate_load, snapshot_test):
|
||||
await health_check(mt0_base, 60)
|
||||
|
||||
responses = await generate_load(
|
||||
@ -60,4 +60,4 @@ async def test_mt0_base_load(mt0_base, generate_load, snapshot):
|
||||
|
||||
assert len(responses) == 4
|
||||
|
||||
assert responses == snapshot
|
||||
assert snapshot_test(responses)
|
||||
|
Loading…
Reference in New Issue
Block a user