only relevant files

dbogunowicz · dbogunowicz · commit 139f388d6573 · 2024-05-06T11:55:28.000Z
diff --git a/moe.py b/moe.py
@@ -0,0 +1,41 @@
+from sparseml.transformers import SparseAutoModelForCausalLM, SparseAutoTokenizer, oneshot
+from copy import deepcopy
+import torch
+
+model_name = "Qwen/Qwen1.5-MoE-A2.7B"
+
+model = SparseAutoModelForCausalLM.from_pretrained(
+    model_name,
+    device_map="cuda:0",
+    torch_dtype=torch.float16,
+)
+og_model = deepcopy(model)
+tokenizer = SparseAutoTokenizer.from_pretrained(
+    model_name
+)
+
+dataset = "open-platypus"
+recipe = "tests/sparseml/transformers/compression/recipes/new_quant_full.yaml"
+
+oneshot(
+        model=model,
+        dataset=dataset,
+        overwrite_output_dir=True,
+        output_dir="./output_one_shot",
+        recipe=recipe,
+        num_calibration_samples=8
+        
+    )
+
+prompt = "Why did the transformer cross the road?"
+prompt_tokenized = tokenizer(prompt, return_tensors="pt").to(model.device)
+print('----')
+print(f"Output from the original model: {tokenizer.decode(og_model.generate(**prompt_tokenized, max_length=50)[0])}")
+print('----')
+tokenizer = SparseAutoTokenizer.from_pretrained("./output_one_shot")
+prompt_tokenized = tokenizer(prompt, return_tensors="pt").to(model.device)
+print(f"Output from the quantized model: {tokenizer.decode(model.generate(**prompt_tokenized, max_length=50)[0])}")
+print('----')
+model = SparseAutoModelForCausalLM.from_pretrained("./output_one_shot", device_map="cuda:1", torch_dtype=torch.float16)
+print(f"Output from the quantized model (reloaded): {tokenizer.decode(model.generate(**prompt_tokenized.to(model.device), max_length=50)[0])}")
+print('----')
diff --git a/setup.py b/setup.py
@@ -78,7 +78,7 @@
     "opencv-python<=4.6.0.66",
 ]
 _transformers_deps = _pytorch_deps + [
-    "transformers<4.40",
+    "transformers<4.41",
     "datasets<2.19",
     "dvc",
     "scikit-learn",

Original file line number	Diff line number	Diff line change
`@@ -78,7 +78,7 @@`
`78`	`78`	`"opencv-python<=4.6.0.66",`
`79`	`79`	`]`
`80`	`80`	`_transformers_deps = _pytorch_deps + [`
`81`		`- "transformers<4.40",`
	`81`	`+ "transformers<4.41",`
`82`	`82`	`"datasets<2.19",`
`83`	`83`	`"dvc",`
`84`	`84`	`"scikit-learn",`