如有脚本可用于评估浮点模型(如 AMD Model Zoo 中的模型),则可将浮点模型文件替换为量化模型用于评估。
为支持自定义 FixNeuron 运算符,应导入 vai_dquantize 模块。下面给出了 1 个示例:
import onnxruntime as ort
from vai_q_onnx.operators.vai_ops.qdq_ops import vai_dquantize
so = ort.SessionOptions()
so.register_custom_ops_library(_lib_path())
sess = ort.InferenceSession(dump_model, so)
input_name = sess.get_inputs()[0].name
results_outputs = sess.run(None, {input_name: input_data})
将浮点模型文件替换为量化模型后,即可像浮点模型一样评估量化模型。