Optimize qwen2_vl and qwen2_5_vl #701

zouyida2052 · 2025-04-28T06:49:47Z

What this PR does / why we need it?

Optimize qwen2_vl and qwen2_5_vl.

Does this PR introduce any user-facing change?

no

How was this patch tested?

Testing this PR on 1080p picture with tp=1, bs=1 on Qwen2-VL and Qwen2.5-VL, every fa op's during time lasting from 11ms to 9ms, got roughly 22% perf boost.

Signed-off-by: zouyida2052 <zouyida@huawei.com>

Signed-off-by: zouyida2052 <zouyida2002@gmail.com>

wangxiyuan · 2025-04-30T06:22:12Z

we should add qwen2 vl to e2e test as well.

zouyida2002 added 2 commits April 28, 2025 12:06

optimize qwen2_vl and qwen2_5_vl

76d0690

Signed-off-by: zouyida2052 <zouyida@huawei.com>

codecheck for qwen2_vl

ccdbf6f

Signed-off-by: zouyida2052 <zouyida@huawei.com>

github-actions bot added the module:ops label Apr 28, 2025

zouyida2052 added 5 commits April 29, 2025 10:01

bugfix for qwen

8ec2102

Signed-off-by: zouyida2052 <zouyida2002@gmail.com>

bugfix for qwen

dbfb6f5

Signed-off-by: zouyida2052 <zouyida2002@gmail.com>

bugfix for qwen

9fb05a3

Signed-off-by: zouyida2052 <zouyida2002@gmail.com>

bugfix for qwen

afc738c

Signed-off-by: zouyida2052 <zouyida2002@gmail.com>

bugfix for qwen

67c7244

Signed-off-by: zouyida2052 <zouyida2002@gmail.com>

wangxiyuan mentioned this pull request Apr 29, 2025

optimize Qwen2.5 vl vit #584

Closed

zouyida2052 added 2 commits April 29, 2025 19:34

bugfix for qwen

56395d6

Signed-off-by: zouyida2052 <zouyida2002@gmail.com>

bugfix for qwen

512d73a

Signed-off-by: zouyida2052 <zouyida2002@gmail.com>

zouyida2052 force-pushed the optimize_qwen_main branch from 4cc82fd to 512d73a Compare April 29, 2025 13:14

bugfix for qwen

03a1bf3

Signed-off-by: zouyida2052 <zouyida2002@gmail.com>

wangxiyuan approved these changes Apr 30, 2025

View reviewed changes

wangxiyuan merged commit ba9714c into vllm-project:main Apr 30, 2025
14 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Optimize qwen2_vl and qwen2_5_vl #701

Optimize qwen2_vl and qwen2_5_vl #701

Uh oh!

zouyida2052 commented Apr 28, 2025 •

edited

Loading

Uh oh!

wangxiyuan commented Apr 30, 2025

Uh oh!

Uh oh!

Uh oh!

Optimize qwen2_vl and qwen2_5_vl #701

Optimize qwen2_vl and qwen2_5_vl #701

Uh oh!

Conversation

zouyida2052 commented Apr 28, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

What this PR does / why we need it?

Does this PR introduce any user-facing change?

How was this patch tested?

Uh oh!

wangxiyuan commented Apr 30, 2025

Uh oh!

Uh oh!

Uh oh!

zouyida2052 commented Apr 28, 2025 •

edited

Loading