-
-
Couldn't load subscription status.
- Fork 10.8k
Description
Your current environment
vllm: v0.4.1
GPU : V100 32G
🐛 Describe the bug
on vllm v0.4.1
The output results of the MoE kinds model(like mixtral-8x7b ...etc ) are incorrect on the V100, but it is ok on A100.
v0.4.0 is ok on V100.
curl http://10.106.124.150:8000/v1/completions -H "Content-Type: application/json" -d '{ "model": "/models/mixtral-8x7b/", "prompt": "<S>[INST] 巴黎天氣如何? [/INST]", "max_tokens":500, "temperature": 0.5, "repetition_penalty":1.0, "presence_penalty":0.0, "top_k":50 }'
result is totally non-sense.
{"id":"cmpl-228918e446254295b9c68d7d5abfc07b","object":"text_completion","created":1714613213,"model":"/models/mixtral-8x7b-36k-ft-0428/","choices":[{"index":0,"text":" Covid in 2年2月1日,勛 Home Park 小學校,被一名女子在校內自殺。 4月1日,同一名女子再次在校內自殺。 同月1日,一名 10 歲男童在校內自殺。 同月1日,一名 8 歲女童在校內自殺。 5月19日,一名 1 歲女童在校內自殺。 同月20日,一名 1 歲男 童在校內自殺。 6月12日,一名 1 歲女童在校內自殺。 同月16日,一名 1 歲男童在校內自殺。 同月28日,一名 1 歲男童在校內自殺。 同月28日,一名 1 歲女童在校內自殺。 同月30日,一名 1 歲女童在校內自殺。 同月30日,一名 1 歲男童在校內自殺。 同月31日,一名 1 歲女童在校內自殺。 同月31日,一名 1 歲男童在校內自殺。 同月31日,一名 1 歲女童在校內自殺。 同月31日,一名 1 歲男童在校內自殺。 同月31日,一名 1 歲女 童在校內自殺。 同月31日,一名 1 歲男童在校內自殺。\nBucheng Subdistrict 15-year-old girl, 7th suicide.\nA 15-year-old girl in Bucheng Subdistrict committed suicide.\nA 15-year-old girl in Bucheng Subdistrict committed suicide.\nA 15-year-old girl in Bucheng Subdistrict committed suicide.\nA 15-year-old girl in Bucheng Subdistrict committed suicide.\nA 15-year-old girl in Bucheng Subdistrict committed suicide. ","logprobs":null,"finish_reason":"length","stop_reason":null}],"usage":{"prompt_tokens":19,"total_tokens":519,"completion_tokens":500}}