[Perf] Add new npu_fused_infer_attention_score op to improve perfomance in splitfuse cases and resolve long-seq mask problems · vllm-project/vllm-ascend@3be8a40

Triggered via pull request September 20, 2025 08:30

labeled #2962

qyqc731:main

Status Cancelled

Total duration 15m 25s

Artifacts 1

image_ubuntu.yml

on: pull_request

1 error

Canceling since a higher priority waiting request for image / Ubuntu-refs/pull/2962/merge exists

Produced during runtime

Name	Size	Digest
vllm-project~vllm-ascend~IRQC91.dockerbuild	105 KB	`sha256:43be3bec13918dfc2a391603f5a4e9b5a74dd1254b1ba854453dfb02a1a5ea1f`