README_cn.md 7.5 KB

English | 简体中文

实时多目标跟踪系统PP-Tracking

PP-Tracking是基于PaddlePaddle深度学习框架的业界首个开源的实时多目标跟踪系统,具有模型丰富、应用广泛和部署高效三大优势。 PP-Tracking支持单镜头跟踪(MOT)和跨镜头跟踪(MTMCT)两种模式,针对实际业务的难点和痛点,提供了行人跟踪、车辆跟踪、多类别跟踪、小目标跟踪、流量统计以及跨镜头跟踪等各种多目标跟踪功能和应用,部署方式支持API调用和GUI可视化界面,部署语言支持Python和C++,部署平台环境支持Linux、NVIDIA Jetson等。


视频来源:VisDrone和BDD100K公开数据集

一、快速开始

AI Studio公开项目案例

PP-Tracking 提供了AI Studio公开项目案例,教程请参考PP-Tracking之手把手玩转多目标跟踪

Python端预测部署

PP-Tracking 支持Python预测部署,教程请参考PP-Tracking Python部署文档

C++端预测部署

PP-Tracking 支持C++预测部署,教程请参考PP-Tracking C++部署文档

GUI可视化界面预测部署

PP-Tracking 提供了简洁的GUI可视化界面,教程请参考PP-Tracking可视化界面试用版使用文档

二、算法介绍

PP-Tracking 支持单镜头跟踪(MOT)和跨镜头跟踪(MTMCT)两种模式。

  • 单镜头跟踪同时支持FairMOTDeepSORT两种多目标跟踪算法,跨镜头跟踪只支持DeepSORT算法。
  • 单镜头跟踪的功能包括行人跟踪、车辆跟踪、多类别跟踪、小目标跟踪以及流量统计,模型主要是基于FairMOT进行优化,实现了实时跟踪的效果,同时基于不同应用场景提供了针对性的预训练模型。
  • DeepSORT算法方案(包括跨镜头跟踪用到的DeepSORT),选用的检测器是PaddleDetection自研的高性能检测模型PP-YOLOv2和轻量级特色检测模型PP-PicoDet,选用的ReID模型是PaddleClas自研的超轻量骨干网络模型PP-LCNet

PP-Tracking中提供的多场景预训练模型以及导出后的预测部署模型如下:

场景 数据集 精度(MOTA) 预测速度(FPS) 配置文件 模型权重 预测部署模型
行人跟踪 MOT17 65.3 23.9 配置文件 下载链接 下载链接
行人小目标跟踪 VisDrone-pedestrian 40.5 8.35 配置文件 下载链接 下载链接
车辆跟踪 BDD100k-vehicle 32.6 24.3 配置文件 下载链接 下载链接
车辆小目标跟踪 VisDrone-vehicle 39.8 22.8 配置文件 下载链接 下载链接
多类别跟踪 BDD100k - 12.5 配置文件 下载链接 下载链接
多类别小目标跟踪 VisDrone 20.4 6.74 配置文件 下载链接 下载链接

注意:

  1. 模型预测速度的设备为NVIDIA Jetson Xavier NX,速度为TensorRT FP16速度,测试环境为CUDA 10.2、JETPACK 4.5.1、TensorRT 7.1。
  2. 模型权重是指使用PaddleDetection训练完直接保存的权重,更多跟踪模型权重请参考多目标跟踪模型库去下载,也可按照相应模型配置文件去训练。
  3. 预测部署模型是指导出后的前向参数的模型,因为PP-Tracking项目的部署过程中只需要前向参数,可根据多目标跟踪模型库去下载并导出,也可按照相应模型配置文件去训练并导出。导出后的模型文件夹应包括infer_cfg.ymlmodel.pdiparamsmodel.pdiparams.infomodel.pdmodel四个文件,一般会将它们以tar格式打包。

引用

@ARTICLE{9573394,
  author={Zhu, Pengfei and Wen, Longyin and Du, Dawei and Bian, Xiao and Fan, Heng and Hu, Qinghua and Ling, Haibin},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Detection and Tracking Meet Drones Challenge},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3119563}
}
@InProceedings{bdd100k,
    author = {Yu, Fisher and Chen, Haofeng and Wang, Xin and Xian, Wenqi and Chen,
              Yingying and Liu, Fangchen and Madhavan, Vashisht and Darrell, Trevor},
    title = {BDD100K: A Diverse Driving Dataset for Heterogeneous Multitask Learning},
    booktitle = {IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
    month = {June},
    year = {2020}
}
@article{zhang2020fair,
  title={FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracking},
  author={Zhang, Yifu and Wang, Chunyu and Wang, Xinggang and Zeng, Wenjun and Liu, Wenyu},
  journal={arXiv preprint arXiv:2004.01888},
  year={2020}
}
@inproceedings{Wojke2018deep,
  title={Deep Cosine Metric Learning for Person Re-identification},
  author={Wojke, Nicolai and Bewley, Alex},
  booktitle={2018 IEEE Winter Conference on Applications of Computer Vision (WACV)},
  year={2018},
  pages={748--756},
  organization={IEEE},
  doi={10.1109/WACV.2018.00087}
}