microsoft · happyme531 · Oct 23, 2025
diff --git a/olive/passes/onnx/conversion.py b/olive/passes/onnx/conversion.py
@@ -655,6 +655,7 @@ def _run_for_config(
     ) -> ONNXModelHandler:
         output_model_path = resolve_onnx_path(output_model_path)
         model_ir = model.load_ir_model()
+        ir.external_data.load_to_model(model_ir)
         version_converter.convert_version(model_ir, config.target_opset, fallback=True)
         return ir_model_to_olive_model(model_ir, output_model_path, config)
 

diff --git a/olive/passes/onnx/hqq_quantization.py b/olive/passes/onnx/hqq_quantization.py
@@ -72,6 +72,7 @@ def _run_for_config(
             return model
         output_model_path = resolve_onnx_path(output_model_path, Path(model.model_path).name)
         ir_model = model.load_ir_model()
+        ir.external_data.load_to_model(ir_model)
         ir_model.graph.opset_imports[MSFT_DOMAIN] = 1
         self._quantize_model(
             ir_model,

diff --git a/olive/passes/onnx/onnxscript_fusion.py b/olive/passes/onnx/onnxscript_fusion.py
@@ -6,6 +6,7 @@
 from pathlib import Path
 
 from onnxscript.rewriter import ort_fusions
+import onnx_ir as ir
 
 from olive.hardware.accelerator import AcceleratorSpec
 from olive.model import ONNXModelHandler
@@ -30,7 +31,8 @@ def _run_for_config(
         output_model_path = resolve_onnx_path(output_model_path, Path(model.model_path).name)
 
         model_ir = model.load_ir_model()
-
+        ir.external_data.load_to_model(model_ir)
+
         # TODO(exporter team): Different fusions support different devices
         model_ir, function_stats = ort_fusions.optimize_for_ort(model_ir)
         logger.debug("Function stats: %s", function_stats)

diff --git a/olive/passes/onnx/rtn_quantization.py b/olive/passes/onnx/rtn_quantization.py
@@ -77,6 +77,7 @@ def _run_for_config(
     ) -> ONNXModelHandler:
         output_model_path = resolve_onnx_path(output_model_path, Path(model.model_path).name)
         ir_model = model.load_ir_model()
+        ir.external_data.load_to_model(ir_model)
         ir_model.graph.opset_imports[MSFT_DOMAIN] = 1
         self._quantize_model(
             ir_model,