yangjun dfa27afb39 提交PaddleDetection develop 分支 d56cf3f7c294a7138013dac21f87da4ea6bee829 | hace 2 años | |
---|---|---|
.. | ||
images | hace 2 años | |
README.md | hace 2 años | |
picodet_lcnet_x1_0_layout.yml | hace 2 años | |
picodet_lcnet_x2_5_layout.yml | hace 2 años |
版面分析指的是对图片形式的文档进行区域划分,定位其中的关键区域,如文字、标题、表格、图片等。版面分析示意图如下图所示。
使用PubLayNet训练英文文档版面分析模型,该数据面向英文文献类(论文)场景,分别训练集(333,703张标注图片)、验证集(11,245张标注图片)和测试集(11,405张图片),包含5类:Table、Figure、Title、Text、List,更多版面分析数据集
使用PicoDet模型在PubLayNet数据集进行训练,同时采用FGD蒸馏,预训练模型如下:
模型 | 图像输入尺寸 | mAPval 0.5 | 下载地址 | 配置文件 |
---|---|---|---|---|
PicoDet-LCNet_x1_0 | 800*608 | 93.5% | trained model | inference model | config |
PicoDet-LCNet_x1_0 + FGD | 800*608 | 94.0% | trained model | inference model | teacher config|student config |