use MLA on rocm

hongxiayang · hongxiayang · commit 3523ce5a10c1 · 2025-02-02T11:10:23.000-06:00
Signed-off-by: Hongxia Yang &lt;hongxia.yang@amd.com&gt;
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
@@ -78,9 +78,6 @@ def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
                              kv_cache_dtype, block_size, use_v1,
                              use_mla) -> str:
         if use_mla:
-            if selected_backend and selected_backend != _Backend.TRITON_MLA:
-                logger.warning(f"Cannot use {selected_backend.name} "
-                               "backend for MLA.")
             logger.info("Using Triton MLA backend.")
             return "vllm.attention.backends.triton_mla.TritonMLABackend"
         selected_backend = (_Backend.ROCM_FLASH if selected_backend