English | 简体中文 | हिन्दी | 日本語 | 한국인 | Pу́сский язы́к
PaddleOCR は、さまざまな言語で、優れた最先端かつ実用的な OCR ツールを作成することを目的とし、ユーザーがより優れたモデルをトレーニングし、実践的に対応できるようになるために役立つAIOCRです。
🔥2022.8.24 リリース PaddleOCR release/2.6
🔥2022.7 リリース OCR scene application collection
🔥2022.5.9 リリース PaddleOCR release/2.5
PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムに対応する、産業用の機能モデル/ソリューション PP-OCR や PP-Structure を開発。これに基づき、データの生成、モデルのトレーニング、圧縮、推論、展開の全プロセスを実行可能。
pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir /your/test/image.jpg --lang=japan # change for i18n abbr
他国の開発者の方は PaddleOCR Discussions を国際的なコミュニティ プラットフォームとして使用します。みなさんのアイデアや質問がある場合、ここで英語で話し合うことができます。
モデル紹介 | モデル名 | 推奨のシーン | 検出モデル | 認識モデル |
---|---|---|---|---|
日本語超軽量 PP-OCRv3 モデル(14.8M) | japan_PP-OCRv3_xx | モバイル & サーバー | 推論モデル/トレーニングモデル | 推論モデル/トレーニングモデル |
英語超軽量PP-OCRv3モデル(13.4M) | en_PP-OCRv3_xx | モバイル & サーバー | 推論モデル / トレーニングモデル | 推論モデル / トレーニングモデル |
中国語と英語の超軽量 PP-OCRv3 モデル(16.2M) | ch_PP-OCRv3_xx | モバイル & サーバー | 推論モデル / トレーニングモデル | 推論モデル / トレーニングモデル |
新言語モデルをリクエストしたい場合、多言語モデルのアップグレードへの投票で投票してください。投票結果に応じて定期的にモデルがアップグレードされます。友達を招待して一緒に投票しましょう!
シナリオに基づいて新しい言語モデルをトレーニング する必要がある場合は、多言語モデル トレーニング プロジェクト のチュートリアルがデータセットの準備にご利用でき、 プロセス全体を段階的に表示することができます。
元の多言語 OCR 開発計画 には、まだ多くの有用なコーパスと辞書が表示されています
PP-OCRv3 多言語モデル
<img src="../imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800">
<img src="../imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800">
PP-OCRv3 英語 モデル
<img src="../imgs_results/PP-OCRv3/en/en_1.png" width="800">
<img src="../imgs_results/PP-OCRv3/en/en_2.png" width="800">
PP-OCRv3 中国語 モデル
<img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic001.jpg" width="800">
<img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic002.jpg" width="800">
<img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic003.jpg" width="800">
PP-Structurev2
このプロジェクトは以下の場所でリリースされています Apache 2.0 license