yangjun dfa27afb39 提交PaddleDetection develop 分支 d56cf3f7c294a7138013dac21f87da4ea6bee829 | 1 ano atrás | |
---|---|---|
.. | ||
configs | 1 ano atrás | |
README.md | 1 ano atrás | |
eval.py | 1 ano atrás | |
post_process.py | 1 ano atrás | |
run.py | 1 ano atrás |
目录:
本示例使用PaddleDetection中Inference部署模型进行自动化压缩,使用的自动化压缩策略为量化蒸馏。
模型 | Base mAP | 离线量化mAP | ACT量化mAP | TRT-FP32 | TRT-FP16 | TRT-INT8 | 配置文件 | 量化模型 |
---|---|---|---|---|---|---|---|---|
PP-YOLOE+_s | 43.7 | - | 42.9 | - | - | - | config | Quant Model |
PP-YOLOE+_m | 49.8 | - | 49.3 | - | - | - | config | Quant Model |
PP-YOLOE+_l | 52.9 | - | 52.6 | - | - | - | config | Quant Model |
PP-YOLOE+_x | 54.7 | - | 54.4 | - | - | - | config | Quant Model |
模型 | Base mAP | 离线量化mAP | ACT量化mAP | TRT-FP32 | TRT-FP16 | TRT-INT8 | 配置文件 | 量化模型 |
---|---|---|---|---|---|---|---|---|
YOLOv8-s | 44.9 | 43.9 | 44.3 | 9.27ms | 4.65ms | 3.78ms | config | Model |
注意:
模型 | Base mAP | 离线量化mAP | ACT量化mAP | TRT-FP32 | TRT-FP16 | TRT-INT8 | 配置文件 | 量化模型 |
---|---|---|---|---|---|---|---|---|
PP-YOLOE-l | 50.9 | - | 50.6 | 11.2ms | 7.7ms | 6.7ms | config | Quant Model |
模型 | 策略 | mAP | FP32 | FP16 | INT8 | 配置文件 | 模型 |
---|---|---|---|---|---|---|---|
PicoDet-S-NPU | Baseline | 30.1 | - | - | - | config | Model |
PicoDet-S-NPU | 量化训练 | 29.7 | - | - | - | config | Model |
安装paddlepaddle:
# CPU
pip install paddlepaddle
# GPU
pip install paddlepaddle-gpu
安装paddleslim:
pip install paddleslim
安装paddledet:
pip install paddledet
注意: YOLOv8模型的自动化压缩需要依赖安装最新Develop Paddle和Develop PaddleSlim版本。
本案例默认以COCO数据进行自动压缩实验,如果自定义COCO数据,或者其他格式数据,请参考数据准备文档 来准备数据。
如果数据集为非COCO格式数据,请修改configs中reader配置文件中的Dataset字段。
以PP-YOLOE模型为例,如果已经准备好数据集,请直接修改[./configs/yolo_reader.yml]中EvalDataset
的dataset_dir
字段为自己数据集路径即可。
预测模型的格式为:model.pdmodel
和 model.pdiparams
两个,带pdmodel
的是模型文件,带pdiparams
后缀的是权重文件。
根据PaddleDetection文档 导出Inference模型,具体可参考下方PP-YOLOE模型的导出示例:
git clone https://github.com/PaddlePaddle/PaddleDetection.git
PPYOLOE-l模型,包含NMS:如快速体验,可直接下载PP-YOLOE-l导出模型
python tools/export_model.py \
-c configs/ppyoloe/ppyoloe_crn_l_300e_coco.yml \
-o weights=https://paddledet.bj.bcebos.com/models/ppyoloe_crn_l_300e_coco.pdparams \
trt=True \
YOLOv8-s模型,包含NMS,具体可参考YOLOv8模型文档, 然后执行:
python tools/export_model.py \
-c configs/yolov8/yolov8_s_500e_coco.yml \
-o weights=https://paddledet.bj.bcebos.com/models/yolov8_s_500e_coco.pdparams \
trt=True
如快速体验,可直接下载YOLOv8-s导出模型
蒸馏量化自动压缩示例通过run.py脚本启动,会使用接口paddleslim.auto_compression.AutoCompression
对模型进行自动压缩。配置config文件中模型路径、蒸馏、量化、和训练等部分的参数,配置完成后便可对模型进行量化和蒸馏。具体运行命令为:
单卡训练:
export CUDA_VISIBLE_DEVICES=0
python run.py --config_path=./configs/ppyoloe_l_qat_dis.yaml --save_dir='./output/'
多卡训练:
CUDA_VISIBLE_DEVICES=0,1,2,3 python -m paddle.distributed.launch --log_dir=log --gpus 0,1,2,3 run.py \
--config_path=./configs/ppyoloe_l_qat_dis.yaml --save_dir='./output/'
使用eval.py脚本得到模型的mAP:
export CUDA_VISIBLE_DEVICES=0
python eval.py --config_path=./configs/ppyoloe_l_qat_dis.yaml
注意:
model_dir
字段下进行修改。