update

ttanzhiqiang · ttanzhiqiang · commit 0b80c6a73c4b · 2025-06-09T15:59:10.000+08:00
Signed-off-by: ttanzhiqiang &lt;389825161@qq.com&gt;
diff --git a/examples/run_dp_attention_etp16.sh b/examples/run_dp_attention_etp16.sh
@@ -18,6 +18,6 @@ nohup python -m vllm.entrypoints.openai.api_server --model=/mnt/deepseek/DeepSee
     --max-num-batched-tokens 32768 \
     --block-size 128 \
     --no-enable-prefix-caching \
-    --additional-config '{"torchair_graph_batch_sizes":[24],"expert_tensor_parallel_size":16,"use_cached_npu_graph":true,"ascend_scheduler_config":{},"enable_graph_mode":true}' \
+    --additional-config '{"torchair_graph_config":{"enabled":true,"use_cached_graph":true,"graph_batch_sizes":[24]},"ascend_scheduler_config":{"enabled":true},"expert_tensor_parallel_size":16}' \
     --gpu-memory-utilization 0.96 &> run.log &
 disown