Skip to content

[Bug]: v0.4.1 The output results of the MoE kinds models are incorrect on the V100 #4547

@keyword1983

Description

@keyword1983

Your current environment

vllm: v0.4.1

GPU : V100 32G

🐛 Describe the bug

on vllm v0.4.1
The output results of the MoE kinds model(like mixtral-8x7b ...etc ) are incorrect on the V100, but it is ok on A100.
v0.4.0 is ok on V100.

curl http://10.106.124.150:8000/v1/completions -H "Content-Type: application/json" -d '{ "model": "/models/mixtral-8x7b/", "prompt": "<S>[INST] 巴黎天氣如何? [/INST]", "max_tokens":500, "temperature": 0.5, "repetition_penalty":1.0, "presence_penalty":0.0, "top_k":50 }'

result is totally non-sense.
{"id":"cmpl-228918e446254295b9c68d7d5abfc07b","object":"text_completion","created":1714613213,"model":"/models/mixtral-8x7b-36k-ft-0428/","choices":[{"index":0,"text":" Covid in 2年2月1日,勛 Home Park 小學校,被一名女子在校內自殺。 4月1日,同一名女子再次在校內自殺。 同月1日,一名 10 歲男童在校內自殺。 同月1日,一名 8 歲女童在校內自殺。 5月19日,一名 1 歲女童在校內自殺。 同月20日,一名 1 歲男 童在校內自殺。 6月12日,一名 1 歲女童在校內自殺。 同月16日,一名 1 歲男童在校內自殺。 同月28日,一名 1 歲男童在校內自殺。 同月28日,一名 1 歲女童在校內自殺。 同月30日,一名 1 歲女童在校內自殺。 同月30日,一名 1 歲男童在校內自殺。 同月31日,一名 1 歲女童在校內自殺。 同月31日,一名 1 歲男童在校內自殺。 同月31日,一名 1 歲女童在校內自殺。 同月31日,一名 1 歲男童在校內自殺。 同月31日,一名 1 歲女 童在校內自殺。 同月31日,一名 1 歲男童在校內自殺。\nBucheng Subdistrict 15-year-old girl, 7th suicide.\nA 15-year-old girl in Bucheng Subdistrict committed suicide.\nA 15-year-old girl in Bucheng Subdistrict committed suicide.\nA 15-year-old girl in Bucheng Subdistrict committed suicide.\nA 15-year-old girl in Bucheng Subdistrict committed suicide.\nA 15-year-old girl in Bucheng Subdistrict committed suicide. ","logprobs":null,"finish_reason":"length","stop_reason":null}],"usage":{"prompt_tokens":19,"total_tokens":519,"completion_tokens":500}}

Metadata

Metadata

Assignees

No one assigned

    Labels

    bugSomething isn't workingstaleOver 90 days of inactivity

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions