SFT example: Use correct source for max_seq_length (#2474)

real-zhangzhe · gufengke · githubnemo · web-flow · commit 896b51548b4c · 2025-04-08T17:41:37.000+02:00
When using Unsloth the SFT example used the wrong source for the `max_seq_length` attribute.
The attribute originates from TRL/TrainingArguments.

---

Co-authored-by: gufengke &lt;gufengke@pinduoduo.com&gt;
Co-authored-by: githubnemo &lt;githubnemo@users.noreply.github.com&gt;
diff --git a/examples/sft/utils.py b/examples/sft/utils.py
@@ -122,7 +122,7 @@ def create_and_prepare_model(args, data_args, training_args):
         # Load model
         model, _ = FastLanguageModel.from_pretrained(
             model_name=args.model_name_or_path,
-            max_seq_length=data_args.max_seq_length,
+            max_seq_length=training_args.max_seq_length,
             dtype=None,
             load_in_4bit=args.use_4bit_quantization,
         )
@@ -198,7 +198,7 @@ def create_and_prepare_model(args, data_args, training_args):
             else args.lora_target_modules,
             use_gradient_checkpointing=training_args.gradient_checkpointing,
             random_state=training_args.seed,
-            max_seq_length=data_args.max_seq_length,
+            max_seq_length=training_args.max_seq_length,
         )
 
     return model, peft_config, tokenizer