MODEL_ZOO_cn.md 8.4 KB

模型库和基线

内容

基础设置

测试环境

  • Python 3.7
  • PaddlePaddle 每日版本
  • CUDA 10.1
  • cuDNN 7.5
  • NCCL 2.4.8

通用设置

  • 所有模型均在COCO17数据集中训练和测试。
  • YOLOv5YOLOv6YOLOv7YOLOv8这几类模型的代码在PaddleYOLO中,PaddleYOLO库开源协议为GPL 3.0
  • 除非特殊说明,所有ResNet骨干网络采用ResNet-B结构。
  • 推理时间(fps): 推理时间是在一张Tesla V100的GPU上通过'tools/eval.py'测试所有验证集得到,单位是fps(图片数/秒), cuDNN版本是7.5,包括数据加载、网络前向执行和后处理, batch size是1。

训练策略

  • 我们采用和Detectron相同的训练策略。
  • 1x 策略表示:在总batch size为8时,初始学习率为0.01,在8 epoch和11 epoch后学习率分别下降10倍,最终训练12 epoch。
  • 2x 策略为1x策略的两倍,同时学习率调整的epoch数位置也为1x的两倍。

ImageNet预训练模型

Paddle提供基于ImageNet的骨架网络预训练模型。所有预训练模型均通过标准的Imagenet-1k数据集训练得到,ResNet和MobileNet等是采用余弦学习率调整策略或SSLD知识蒸馏训练得到的高精度预训练模型,可在PaddleClas查看模型细节。

基线

目标检测

Faster R-CNN

请参考Faster R-CNN

YOLOv3

请参考YOLOv3

PP-YOLOE/PP-YOLOE+

请参考PP-YOLOE

PP-YOLO/PP-YOLOv2

请参考PP-YOLO

PicoDet

请参考PicoDet

RetinaNet

请参考RetinaNet

Cascade R-CNN

请参考Cascade R-CNN

SSD/SSDLite

请参考SSD

FCOS

请参考FCOS

CenterNet

请参考CenterNet

TTFNet/PAFNet

请参考TTFNet

Group Normalization

请参考Group Normalization

Deformable ConvNets v2

请参考Deformable ConvNets v2

HRNets

请参考HRNets

Res2Net

请参考Res2Net

ConvNeXt

请参考ConvNeXt

GFL

请参考GFL

TOOD

请参考TOOD

PSS-DET(RCNN-Enhance)

请参考PSS-DET

DETR

请参考DETR

Deformable DETR

请参考Deformable DETR

Sparse R-CNN

请参考Sparse R-CNN

Vision Transformer

请参考Vision Transformer

YOLOX

请参考YOLOX

YOLOF

请参考YOLOF

实例分割

Mask R-CNN

请参考Mask R-CNN

Cascade R-CNN

请参考Cascade R-CNN

SOLOv2

请参考SOLOv2

PaddleYOLO

请参考PaddleYOLO模型库

YOLOv5

请参考YOLOv5

YOLOv6(v3.0)

请参考YOLOv6

YOLOv7

请参考YOLOv7

YOLOv8

请参考YOLOv8

RTMDet

请参考RTMDet

人脸检测

请参考人脸检测模型库

BlazeFace

请参考BlazeFace

旋转框检测

请参考旋转框检测模型库

PP-YOLOE-R

请参考PP-YOLOE-R

FCOSR

请参考FCOSR

S2ANet

请参考S2ANet

关键点检测

请参考关键点检测模型库

PP-TinyPose

请参考PP-TinyPose

HRNet

请参考HRNet

Lite-HRNet

请参考Lite-HRNet

HigherHRNet

请参考HigherHRNet

多目标跟踪

请参考多目标跟踪模型库

DeepSORT

请参考DeepSORT

ByteTrack

请参考ByteTrack

OC-SORT

请参考OC-SORT

BoT-SORT

请参考BoT-SORT

CenterTrack

请参考CenterTrack

FairMOT/MC-FairMOT

请参考FairMOT

JDE

请参考JDE