GitHub - AXERA-TECH/QAT.Ultralytics

工程基于Ultralytics仓库用于做yolo系列的QAT训练；

model	map@50-95	map@50
yolov11s.pt	0.466	0.635
yolov11s_8w8f_qdq.onnx	0.456	0.628

环境安装

基于官方工程，安装ultralytics库

pip install -r requirements.txt

安装额外库

pip install ultralytics

我们发现 onnxruntime 和 onnxscript 的其他版本可能引起精度误差和导出错误，因此pytorch==2.6; onnxruntime==1.21.0 onnxscript==0.4.0 是必须的。

数据集路径修改

修改 ./ultralytics/cfg/datasets/coco.yaml 中的数据集路径;

QAT训练

python train.py

onnx eval

python eval.py

eval精度如下：

Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.456
Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.628
Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.495
Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.286
Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.498
Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.633
Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.354
Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.591
Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.645
Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.463
Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.698
Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.810

onnx test

python test.py

test会加载根目录下的bus.jpg文件进行推理，然后输出推理结果

onnx转AXModel

1、模型

使用yolo11s_qat_slim.onnx

2、配置文件

{
  "model_type": "QuantONNX",
  "npu_mode": "NPU1",
  "quant": {
    "input_configs": [
      {
        "tensor_name": "DEFAULT",
        "calibration_dataset": "s3://npu-ci/data/data.zip"
      }
    ],
    "calibration_method": "MinMax",
    "layer_configs":  [
      {
        "op_types": ["MatMul"],
        "data_type": "S16",
      },
      {
        "layer_names": ["node_Reshape_740", "node_Split_1800", "node_Transpose_765", "node_Transpose_791"],
        "data_type": "S16",
      },
    ],
  },
  "compiler": {
    "check": 2
  }
}

其中layer_names中的节点为MatMul节点前的reshape,split,transpose等算子。

2.1 使用Netron打开`yolo11s_qat_slim.onnx`进行查找，搜索`MatMul`

第二处：

2.2 将相关节点放入`layer_names`中，并置为`S16`数据类型。

注：QAT时为保证MatMul算子精度，避免上溢出等问题，未对MatMul做更细粒度的量化，而MatMul前的shape变换算子，被统一纳入子图做QAT，它们在训练时的量化精度相同，所以在转换时需要与MatMul算子置为相同的量化数据类型。

3、转换

pulsar2 build --input ./weights/yolo11s_qat_slim.onnx --config ./config.json --output_dir ./output

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
assets		assets
docker		docker
docs		docs
examples		examples
tests		tests
ultralytics		ultralytics
CITATION.cff		CITATION.cff
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
README.zh-CN.md		README.zh-CN.md
README_org.md		README_org.md
bus.jpg		bus.jpg
config.json		config.json
eval.py		eval.py
mkdocs.yml		mkdocs.yml
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
test.py		test.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

环境安装

数据集路径修改

QAT训练

onnx eval

onnx test

onnx转AXModel

1、模型

2、配置文件

2.1 使用Netron打开`yolo11s_qat_slim.onnx`进行查找，搜索`MatMul`

2.2 将相关节点放入`layer_names`中，并置为`S16`数据类型。

3、转换

About

Uh oh!

Releases 1

Packages

Contributors 3

Uh oh!

Languages

License

AXERA-TECH/QAT.Ultralytics

Folders and files

Latest commit

History

Repository files navigation

环境安装

数据集路径修改

QAT训练

onnx eval

onnx test

onnx转AXModel

1、模型

2、配置文件

2.1 使用Netron打开yolo11s_qat_slim.onnx进行查找，搜索MatMul

2.2 将相关节点放入layer_names中，并置为S16数据类型。

3、转换

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Contributors 3

Uh oh!

Languages

2.1 使用Netron打开`yolo11s_qat_slim.onnx`进行查找，搜索`MatMul`

2.2 将相关节点放入`layer_names`中，并置为`S16`数据类型。

Packages