foundation-model-stack
diff --git a/‎aiu_fms_testing_utils/utils/direct_quantization.py
Lines changed: 0 additions & 260 deletions b/‎aiu_fms_testing_utils/utils/direct_quantization.py
Lines changed: 0 additions & 260 deletions
diff --git a/‎scripts/run_encoder.py
Lines changed: 2 additions & 12 deletions b/‎scripts/run_encoder.py
Lines changed: 2 additions & 12 deletions
@@ -10,6 +10,7 @@
 # Local Packages
 from aiu_fms_testing_utils.utils.aiu_setup import dprint, rank, world_size
 from aiu_fms_testing_utils.utils.args_parsing import get_args
+from aiu_fms_testing_utils.utils.direct_quantization import run_dq_roberta
 from aiu_fms_testing_utils.utils.encoders_utils import (
     wrap_encoder,
     run_encoder_eval_qa,
@@ -37,17 +38,6 @@
 # Main model setup
 default_dtype, device, dist_strat = setup_model(args)
 
-model_path = args.model_path
-if args.int8_direct_quantization:
-    save_path = None
-
-    # !!! insert DQ for encoders here
-    # pass default_dtype to DQ function
-
-    # if DQ is used, args.model_path represent FP16 ckpt but we need to load the
-    # newly-created INT8 ckpt. Without DQ, args.model_path is the INT8 ckpt already.
-    model_path = save_path
-
 # Retrieve linear configuration (quantized or not) to instantiate FMS model
 linear_config = get_linear_config(args)
 
@@ -64,7 +54,7 @@
 model = get_model(
     args.architecture,
     args.variant,
-    model_path=model_path,
+    model_path=args.model_path,
     device_type="cpu" if args.is_aiu_backend else args.device_type,
     data_type=default_dtype,
     source=args.model_source,