Others/DocumentAIKit: 管理Document AI的工具、训练配置、模型等 @ b3d18d7e6ee1ddd35c8b3937f095795b76b8f679

소개

PaddleOCR은 사용자들이 보다 나은 모델을 훈련하여 실전에 투입하는데 도움을 주는 다중 언어로 된 엄청나게 멋지고 주도적이며 실용적인 OCR 툴을 만드는데 목표를 두고 있습니다.

<img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800">

<img src="../imgs_results/PP-OCRv3/en/en_4.png" width="800">

📣최근 업데이트

🔥2022년 8월 24일에 패들 OCR 출시 출시/2.6 차이니즈 씬에 맞춘 완전 업그레이드 된 기능과 성능을 갖춘 ; PP-Structurev2 출시, 그리고 레이아웃 리커버리 ](../../ppstructure/recovery) 신규 지원 및 PDF 를 워드로 전환하는 원 라인 명령
- 레이아웃 분석 최적화: 95% 감소된 모델 저장, while 반면 속도는 11배 증가하고, 평균 CPU 시간 비용은 41ms에 불과함;
- 표 인식 최적화: 3 최적화 전략이 디자인되고 모델 정확도는 비교 가능한 시간 소비 하에 6% 개선됨;
- 핵심 정보 추출 최적화： 시각에 의존하지 않는 모델 구조가 디자인되고, 의미체 인식 정확도가 2.8% 증가되며 관계 추출 정확도는 9.1% 증가됨.
🔥2022년 7월 출시OCR 씬 애플리케이션 컬렉션 디지털 튜브, LCD 스크린, 라이선스 플레이트, 수기 인식 모델, 고정밀 SVTR 모델 등등과 같은 “9수직 모델” 출시로, 일반적으로 주된 OCR 수직 애플리케이션, 제조, 금융 및 수송 산업 커버
🔥2022년 5월 9일에 패들 OCR 출시 출시/2.5
- PP-OCRv3출시: 5%.비교 가능한 속도로, 차이니즈 씬의 효과는 PP-OCRv2와 비교해 볼 때 추가로 5% 정도 더 개선되고, 잉글리쉬 씬 효과는 11% 개선되었으며, 80개 언어 다중 언어 모델 평균 인식 정확도는 5% 이상 개선됨.
- PPOCRLabelv2출시: 표 인식 업무, 핵심 정보 추출 업무 및 불규칙한 텍스트 이미지주석 기능 추가.
- 쌍방향e-북 출시 "OCR 뛰어들기", 첨단 이론 및 OCR 정식 스택 기술 코드 연습 포함.
추가

🌟특징

패들OCR은 OCR 관련 다양한 첨단 알고리즘 지원 PP-OCR 및 PP-Structure 이를 기반으로, 그리고 전체 데이터 생산 처리, 모델 훈련, 압축, 추론 및 배치를 통해 획득.

⚡ 신속한 경험

pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir /your/test/image.jpg --lang=korean

만일 당신이 파이톤 환경이 없다면 [환경 준비]를 따르기 바람(../doc_en/environment_en.md). 우리는 당신이[사용지침 프로그램]으로 시작할 것을 권장합니다.(#Tutorials).

📚 E-북: OCR로 뛰어들기

OCR로 뛰어들기

👫 커뮤니티로

국제 개발자들을 위해 우리는 PaddleOCR 논의하기 를 우리의 국제 커뮤니티로 간주. 모든 아이디어와 질문은 여기서 영어로 논의 가능.

PP-OCR 시리즈 모델 목록

모델 소개	모델 명	권장 씬	감지 모델	인식 모델
한국어 초경량 PP-OCRv3 모델(14.8M)	korean_PP-OCRv3_xx	모바일 & 서버	추론 모델 / 훈련 모델	추론 모델 / 훈련 모델
영어 초경량 PP-OCRv3 모델（13.4M）	en_PP-OCRv3_xx	모바일 & 서버	추론 모델 / 훈련 모델	추론 모델 / 훈련 모델
중국어 및 영어 초경량 PP-OCRv3 model（16.2M）	ch_PP-OCRv3_xx	모바일 & 서버	추론 모델 / 훈련 모델	추론 모델 / 훈련 모델

(다중 언어를 포함하여)더 많은 모델을 다운로드 하려면, PP-OCR 시리즈 모델 다운로드를 참조할 것.
신규 언어 요청에 대해서는, 신규 언어 요청 지침을 참조할 것.
구조적 문서 분석 모델에 대해서는, PP-Structure models.을 참조할 것.

📖 사용 지침 프로그램

신규 언어 요청에 대한 유엔 가이드라인

만일 신규 언어 모델을 요청하고자 한다면, 다중 언어 모델 업그레이드 투표하기에서 투표하기 바람. 우리는 결과에 따라 규칙적으로 모델을 업그레이드 시킬 것임함께 투표하고자 당신의 친구들을 초대할 것!** 만일 당신이 시나리오 기반 “신규 언어 모델”을 훈련하고자 한다면, 다중 언어 모델 훈련 프로젝트 를 통해 당신의 데이터세트를 작성하는데 도움이 되고 단계별로 전체 절차를 보여줄 것입니다. 원본다중 언어 OCR 개발 계획은 여전히 수많은 유용한 말뭉치와 사전을 보여줍니다.

👀 시각화추가

PP-OCRv3 다중 언어 모델

<img src="../imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800">
<img src="../imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800">

PP-OCRv3 영어 모델

<img src="../imgs_results/PP-OCRv3/en/en_1.png" width="800">
<img src="../imgs_results/PP-OCRv3/en/en_2.png" width="800">

PP-OCRv3 중국어 모델

<img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic001.jpg" width="800">
<img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic002.jpg" width="800">
<img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic003.jpg" width="800">

PP-Structurev2