fix llama13b bug (#10525)

chen2016013 · web-flow · commit fea8d82586ad · 2025-05-07T11:28:06.000+08:00
diff --git a/tests/test_tipc/static/auto_parallel/llama2/pretrain_config_llama2_13b/intermediate_api_pretrain-llama2_13b.json b/tests/test_tipc/static/auto_parallel/llama2/pretrain_config_llama2_13b/intermediate_api_pretrain-llama2_13b.json
@@ -18,10 +18,10 @@
   "virtual_pp_degree": 5,
   "sequence_parallel": 0,   
   "use_flash_attention": true,
-  "use_fused_rms_norm": false,
+  "use_fused_rms_norm": true,
   "fuse_attention_ffn": true,
   "fuse_attention_qkv": true,
-  "use_fused_rope": false,
+  "use_fused_rope": true,
   "fused_linear_param_grad_add": true,
   "max_seq_length": 4096,
   "learning_rate": 3e-05,