[DLIGHT][GPU] Improve matmul schedule for adreno #17430

krishnaraj36 · 2024-09-30T05:51:31Z

Improved matmul schedule with layout transpose approach, which improves as follows -

----Model-------prefill baseline ---------prefill optimized
--Llama-2-7b-------51 tok/sec --------------86 tok/sec
--Llama-3-8b-------48 tok/sec --------------79 tok/sec
--gemma-2b -------140 tok/sec -------------245 tok/sec

Improved matmul schedule with layout transpose approach, which improves as follows - ----Model-------prefill baseline ---------prefill optimized --Llama-2-7b-------51 tok/sec --------------86 tok/sec --Llama-3-8b-------48 tok/sec --------------79 tok/sec --gemma-2b -------140 tok/sec -------------245 tok/sec --------- Co-authored-by: krishnaraj36 <[email protected]>

tqchen approved these changes Sep 30, 2024

View reviewed changes

tqchen merged commit e808010 into apache:main Sep 30, 2024
14 checks passed

ysh329 mentioned this pull request Oct 16, 2024

[Release] v0.18.0 Release Candidate Notes #17468

Closed

kurisu6912 mentioned this pull request Sep 5, 2025

kurisu add assume attr patch 1 tile-ai/tvm#8

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[DLIGHT][GPU] Improve matmul schedule for adreno #17430

[DLIGHT][GPU] Improve matmul schedule for adreno #17430

Uh oh!

krishnaraj36 commented Sep 30, 2024

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

[DLIGHT][GPU] Improve matmul schedule for adreno #17430

[DLIGHT][GPU] Improve matmul schedule for adreno #17430

Uh oh!

Conversation

krishnaraj36 commented Sep 30, 2024

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants