Changing test_gpu_examples.py and check the arrow test to be passed.

TheTahaaa · TheTahaaa · commit 12d994a7ba99 · 2025-08-27T18:04:01.000+03:30
diff --git a/tests/test_gpu_examples.py b/tests/test_gpu_examples.py
@@ -66,7 +66,6 @@
     PrefixTuningConfig,
     PromptEncoderConfig,
     RandLoraConfig,
-    RoadConfig,
     TaskType,
     VeraConfig,
     create_arrow_model,
@@ -1722,226 +1721,6 @@ def test_causal_lm_training_multi_gpu_4bit_randlora(self):
             # assert loss is not None
             assert trainer.state.log_history[-1]["train_loss"] is not None
 
-    @pytest.mark.single_gpu_tests
-    def test_causal_lm_training_8bit_road(self):
-        r"""
-        Same as test_causal_lm_training but with RoAd
-        """
-        with tempfile.TemporaryDirectory() as tmp_dir:
-            model = AutoModelForCausalLM.from_pretrained(
-                self.causal_lm_model_id,
-                quantization_config=BitsAndBytesConfig(load_in_8bit=True),
-                device_map="auto",
-            )
-
-            tokenizer = AutoTokenizer.from_pretrained(self.causal_lm_model_id)
-            model = prepare_model_for_kbit_training(model)
-
-            config = RoadConfig(
-                variant="road_1",
-                target_modules=["q_proj", "v_proj"],
-                task_type="CAUSAL_LM",
-            )
-
-            model = get_peft_model(model, config)
-
-            data = load_dataset("ybelkada/english_quotes_copy")
-            data = data.map(lambda samples: tokenizer(samples["quote"]), batched=True)
-
-            trainer = Trainer(
-                model=model,
-                train_dataset=data["train"],
-                args=TrainingArguments(
-                    per_device_train_batch_size=4,
-                    gradient_accumulation_steps=4,
-                    warmup_steps=2,
-                    max_steps=3,
-                    learning_rate=1e-3,
-                    fp16=True,
-                    logging_steps=1,
-                    output_dir=tmp_dir,
-                ),
-                data_collator=DataCollatorForLanguageModeling(tokenizer, mlm=False),
-            )
-            model.config.use_cache = False
-            trainer.train()
-
-            model.cpu().save_pretrained(tmp_dir)
-
-            assert "adapter_config.json" in os.listdir(tmp_dir)
-            assert SAFETENSORS_WEIGHTS_NAME in os.listdir(tmp_dir)
-
-            # assert loss is not None
-            assert trainer.state.log_history[-1]["train_loss"] is not None
-
-    @pytest.mark.single_gpu_tests
-    def test_causal_lm_training_4bit_road(self):
-        r"""
-        Same as test_causal_lm_training_4bit but with RoAd
-        """
-        with tempfile.TemporaryDirectory() as tmp_dir:
-            model = AutoModelForCausalLM.from_pretrained(
-                self.causal_lm_model_id,
-                quantization_config=BitsAndBytesConfig(load_in_4bit=True),
-                device_map="auto",
-            )
-
-            tokenizer = AutoTokenizer.from_pretrained(self.causal_lm_model_id)
-            model = prepare_model_for_kbit_training(model)
-
-            config = RoadConfig(
-                variant="road_1",
-                target_modules=["q_proj", "v_proj"],
-                task_type="CAUSAL_LM",
-            )
-
-            model = get_peft_model(model, config)
-
-            data = load_dataset("ybelkada/english_quotes_copy")
-            data = data.map(lambda samples: tokenizer(samples["quote"]), batched=True)
-
-            trainer = Trainer(
-                model=model,
-                train_dataset=data["train"],
-                args=TrainingArguments(
-                    per_device_train_batch_size=4,
-                    gradient_accumulation_steps=4,
-                    warmup_steps=2,
-                    max_steps=3,
-                    learning_rate=1e-3,
-                    fp16=True,
-                    logging_steps=1,
-                    output_dir=tmp_dir,
-                ),
-                data_collator=DataCollatorForLanguageModeling(tokenizer, mlm=False),
-            )
-            model.config.use_cache = False
-            trainer.train()
-
-            model.cpu().save_pretrained(tmp_dir)
-
-            assert "adapter_config.json" in os.listdir(tmp_dir)
-            assert SAFETENSORS_WEIGHTS_NAME in os.listdir(tmp_dir)
-
-            # assert loss is not None
-            assert trainer.state.log_history[-1]["train_loss"] is not None
-
-    @pytest.mark.multi_gpu_tests
-    def test_causal_lm_training_multi_gpu_8bit_road(self):
-        r"""
-        Same as test_causal_lm_training_multi_gpu but with RoAd
-        """
-
-        with tempfile.TemporaryDirectory() as tmp_dir:
-            model = AutoModelForCausalLM.from_pretrained(
-                self.causal_lm_model_id,
-                device_map=DEVICE_MAP_MAP[self.causal_lm_model_id],
-                quantization_config=BitsAndBytesConfig(load_in_8bit=True),
-            )
-
-            assert set(model.hf_device_map.values()) == set(range(device_count))
-            assert {p.device.index for p in model.parameters()} == set(range(device_count))
-
-            model = prepare_model_for_kbit_training(model)
-
-            setattr(model, "model_parallel", True)
-            setattr(model, "is_parallelizable", True)
-
-            config = RoadConfig(
-                variant="road_1",
-                target_modules=["q_proj", "v_proj"],
-                task_type="CAUSAL_LM",
-            )
-
-            model = get_peft_model(model, config)
-
-            data = load_dataset("Abirate/english_quotes")
-            data = data.map(lambda samples: self.tokenizer(samples["quote"]), batched=True)
-
-            trainer = Trainer(
-                model=model,
-                train_dataset=data["train"],
-                args=TrainingArguments(
-                    per_device_train_batch_size=4,
-                    gradient_accumulation_steps=4,
-                    warmup_steps=2,
-                    max_steps=3,
-                    learning_rate=1e-3,
-                    fp16=True,
-                    logging_steps=1,
-                    output_dir=tmp_dir,
-                ),
-                data_collator=DataCollatorForLanguageModeling(self.tokenizer, mlm=False),
-            )
-            model.config.use_cache = False
-            trainer.train()
-
-            model.cpu().save_pretrained(tmp_dir)
-
-            assert "adapter_config.json" in os.listdir(tmp_dir)
-            assert SAFETENSORS_WEIGHTS_NAME in os.listdir(tmp_dir)
-
-            # assert loss is not None
-            assert trainer.state.log_history[-1]["train_loss"] is not None
-
-    @pytest.mark.multi_gpu_tests
-    def test_causal_lm_training_multi_gpu_4bit_road(self):
-        r"""
-        Same as test_causal_lm_training_multi_gpu_4bit but with RoAd
-        """
-
-        with tempfile.TemporaryDirectory() as tmp_dir:
-            model = AutoModelForCausalLM.from_pretrained(
-                self.causal_lm_model_id,
-                device_map=DEVICE_MAP_MAP[self.causal_lm_model_id],
-                quantization_config=BitsAndBytesConfig(load_in_4bit=True),
-            )
-
-            assert set(model.hf_device_map.values()) == set(range(device_count))
-            assert {p.device.index for p in model.parameters()} == set(range(device_count))
-
-            model = prepare_model_for_kbit_training(model)
-
-            setattr(model, "model_parallel", True)
-            setattr(model, "is_parallelizable", True)
-
-            config = RoadConfig(
-                variant="road_1",
-                target_modules=["q_proj", "v_proj"],
-                task_type="CAUSAL_LM",
-            )
-
-            model = get_peft_model(model, config)
-
-            data = load_dataset("Abirate/english_quotes")
-            data = data.map(lambda samples: self.tokenizer(samples["quote"]), batched=True)
-
-            trainer = Trainer(
-                model=model,
-                train_dataset=data["train"],
-                args=TrainingArguments(
-                    per_device_train_batch_size=4,
-                    gradient_accumulation_steps=4,
-                    warmup_steps=2,
-                    max_steps=3,
-                    learning_rate=1e-3,
-                    fp16=True,
-                    logging_steps=1,
-                    output_dir=tmp_dir,
-                ),
-                data_collator=DataCollatorForLanguageModeling(self.tokenizer, mlm=False),
-            )
-            model.config.use_cache = False
-            trainer.train()
-
-            model.cpu().save_pretrained(tmp_dir)
-
-            assert "adapter_config.json" in os.listdir(tmp_dir)
-            assert SAFETENSORS_WEIGHTS_NAME in os.listdir(tmp_dir)
-
-            # assert loss is not None
-            assert trainer.state.log_history[-1]["train_loss"] is not None
-
     @pytest.mark.single_gpu_tests
     def test_causal_lm_training_lora_resize_embeddings_trainable_tokens(self):
         r"""