You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

119 lines
9.0 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

---
comments: true
hide:
- navigation
- toc
---
### 更新
#### 2024-06-06 **📚直播和OCR实战打卡营预告**
《PP-ChatOCRv2赋能金融报告信息智能化抽取新金融效率再升级》课程上线破解复杂版面、表格识别、信息抽取OCR解析难题直播时间6月6日周四1900。并于6月11日启动【政务采购合同信息抽取】实战打卡营。报名链接<https://www.wjx.top/vm/eBcYmqO.aspx?udsid=197406>
#### **🔥2024.5.10 上线星河零代码产线(OCR 相关)**
全面覆盖了以下四大 OCR 核心任务,提供极便捷的 Badcase 分析和实用的在线体验
- [通用 OCR](https://aistudio.baidu.com/community/app/91660) (PP-OCRv4)。
- [通用表格识别](https://aistudio.baidu.com/community/app/91661) (SLANet)。
- [通用图像信息抽取](https://aistudio.baidu.com/community/app/91662) (PP-ChatOCRv2-common)。
- [文档场景信息抽取](https://aistudio.baidu.com/community/app/70303) (PP-ChatOCRv2-doc)。
同时采用了 **[全新的场景任务开发范式](https://aistudio.baidu.com/pipeline/mine)** ,将模型统一汇聚,实现训练部署的零代码开发,并支持在线服务化部署和导出离线服务化部署包。
#### 🔥2023.8.7 发布 PaddleOCR [release/2.7](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.7)
- 发布[PP-OCRv4](./doc/doc_ch/PP-OCRv4_introduction.md),提供 mobile 和 server 两种模型
- PP-OCRv4-mobile速度可比情况下中文场景效果相比于 PP-OCRv3 再提升 4.5%,英文场景提升 10%80 语种多语言模型平均识别准确率提升 8%以上
- PP-OCRv4-server发布了目前精度最高的 OCR 模型,中英文场景上检测模型精度提升 4.9% 识别模型精度提升 2%
可参考[快速开始](./doc/doc_ch/quickstart.md) 一行命令快速使用,同时也可在飞桨 AI 套件(PaddleX)中的[通用 OCR 产业方案](https://aistudio.baidu.com/aistudio/modelsdetail?modelId=286)中低代码完成模型训练、推理、高性能部署全流程
#### 🔨**2022.11 新增实现[4 种前沿算法](doc/doc_ch/algorithm_overview.md)**:文本检测 [DRRG](doc/doc_ch/algorithm_det_drrg.md), 文本识别 [RFL](doc/doc_ch/algorithm_rec_rfl.md), 文本超分[Text Telescope](doc/doc_ch/algorithm_sr_telescope.md),公式识别[CAN](doc/doc_ch/algorithm_rec_can.md)
#### **2022.10 优化[JS 版 PP-OCRv3 模型](./deploy/paddlejs/README_ch.md)**:模型大小仅 4.3M,预测速度提升 8 倍,配套 web demo 开箱即用
- **💥 直播回放PaddleOCR 研发团队详解 PP-StructureV2 优化策略**。微信扫描[下方二维码](#开源社区),关注公众号并填写问卷后进入官方交流群,获取直播回放链接与 20G 重磅 OCR 学习大礼包(内含 PDF 转 Word 应用程序、10 种垂类模型、《动手学 OCR》电子书等
#### **🔥2022.8.24 发布 PaddleOCR [release/2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)**
- 发布[PP-StructureV2](./ppstructure/README_ch.md),系统功能性能全面升级,适配中文场景,新增支持[版面复原](./ppstructure/recovery/README_ch.md),支持**一行命令完成 PDF 转 Word**
- [版面分析](./ppstructure/layout/README_ch.md)模型优化:模型存储减少 95%,速度提升 11 倍,平均 CPU 耗时仅需 41ms
- [表格识别](./ppstructure/table/README_ch.md)模型优化:设计 3 大优化策略,预测耗时不变情况下,模型精度提升 6%
- [关键信息抽取](./ppstructure/kie/README_ch.md)模型优化:设计视觉无关模型结构,语义实体识别精度提升 2.8%,关系抽取精度提升 9.1%。
#### **2022.8 发布 [OCR 场景应用集合](./applications)**:包含数码管、液晶屏、车牌、高精度 SVTR 模型、手写体识别等**9 个垂类模型**,覆盖通用,制造、金融、交通行业的主要 OCR 垂类应用
#### 2022.5.9 发布PaddleOCR v2.5。发布内容包括
- [PP-OCRv3](./ppocr_introduction.md#pp-ocrv3)速度可比情况下中文场景效果相比于PP-OCRv2再提升5%英文场景提升11%80语种多语言模型平均识别准确率提升5%以上;
- 半自动标注工具[PPOCRLabelv2](https://github.com/PFCCLab/PPOCRLabel):新增表格文字图像、图像关键信息抽取任务和不规则文字图像的标注功能;
- OCR产业落地工具集打通22种训练部署软硬件环境与方式覆盖企业90%的训练部署环境需求
- 交互式OCR开源电子书[《动手学OCR》](./ocr_book.md)覆盖OCR全栈技术的前沿理论与代码实践并配套教学视频。
#### 2022.5.7 添加对[Weights & Biases](https://docs.wandb.ai/)训练日志记录工具的支持
#### 2021.12.21 《OCR十讲》课程开讲12月21日起每晚八点半线上授课 【免费】报名地址:<https://aistudio.baidu.com/aistudio/course/introduce/25207>
#### 2021.12.21 发布PaddleOCR v2.4。OCR算法新增1种文本检测算法PSENet3种文本识别算法NRTR、SEED、SAR文档结构化算法新增1种关键信息提取算法SDMGR3种DocVQA算法LayoutLM、LayoutLMv2LayoutXLM
#### 2021.9.7 发布PaddleOCR v2.3,发布[PP-OCRv2](#PP-OCRv2)CPU推理速度相比于PP-OCR server提升220%效果相比于PP-OCR mobile 提升7%
#### 2021.8.3 发布PaddleOCR v2.2,新增文档结构分析[PP-Structure](https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/ppstructure/README_ch.md)工具包支持版面分析与表格识别含Excel导出
#### 2021.6.29 [FAQ](https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/doc/doc_ch/FAQ.md)新增5个高频问题总数248个每周一都会更新欢迎大家持续关注
#### 2021.4.8 release 2.1版本新增AAAI 2021论文[端到端识别算法PGNet](https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/doc/doc_ch/pgnet.md)开源,[多语言模型](https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/doc/doc_ch/multi_languages.md)支持种类增加到80+
#### 2020.12.15 更新数据合成工具[Style-Text](https://github.com/PFCCLab/StyleText/blob/main/README_ch.md),可以批量合成大量与目标场景类似的图像,在多个场景验证,效果明显提升
#### 2020.12.07 [FAQ](../../doc/doc_ch/FAQ.md)新增5个高频问题总数124个并且计划以后每周一都会更新欢迎大家持续关注
#### 2020.11.25 更新半自动标注工具[PPOCRLabel](https://github.com/PFCCLab/PPOCRLabel/blob/main/README_ch.md)辅助开发者高效完成标注任务输出格式与PP-OCR训练任务完美衔接
#### 2020.9.22 更新PP-OCR技术文章<https://arxiv.org/abs/2009.09941>
#### 2020.9.19 更新超轻量压缩ppocr_mobile_slim系列模型整体模型3.5M(详见PP-OCR Pipeline),适合在移动端部署使用
#### 2020.9.17 更新超轻量ppocr_mobile系列和通用ppocr_server系列中英文ocr模型媲美商业效果
#### 2020.9.17 更新[英文识别模型](./models_list.md#english-recognition-model)和[多语种识别模型](./models_list.md#english-recognition-model),已支持`德语、法语、日语、韩语`,更多语种识别模型将持续更新
#### 2020.8.26 更新OCR相关的84个常见问题及解答具体参考[FAQ](./FAQ.md)
#### 2020.8.24 支持通过whl包安装使用PaddleOCR具体参考[Paddleocr Package使用说明](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/whl.md)
#### 2020.8.21 更新8月18日B站直播课回放和PPT课节2易学易用的OCR工具大礼包[获取地址](https://aistudio.baidu.com/aistudio/education/group/info/1519)
#### 2020.8.16 开源文本检测算法[SAST](https://arxiv.org/abs/1908.05498)和文本识别算法[SRN](https://arxiv.org/abs/2003.12294)
#### 2020.7.23 发布7月21日B站直播课回放和PPT课节1PaddleOCR开源大礼包全面解读[获取地址](https://aistudio.baidu.com/aistudio/course/introduce/1519)
#### 2020.7.15 添加基于EasyEdge和Paddle-Lite的移动端DEMO支持iOS和Android系统
#### 2020.7.15 完善预测部署添加基于C++预测引擎推理、服务化部署和端侧部署方案以及超轻量级中文OCR模型预测耗时Benchmark
#### 2020.7.15 整理OCR相关数据集、常用数据标注以及合成工具
#### 2020.7.9 添加支持空格的识别模型,识别效果,预测及训练方式请参考快速开始和文本识别训练相关文档
#### 2020.7.9 添加数据增强、学习率衰减策略,具体参考[配置文件](./config.md)
#### 2020.6.8 添加[数据集](dataset/datasets.md),并保持持续更新
#### 2020.6.5 支持 `attetnion` 模型导出 `inference_model`
#### 2020.6.5 支持单独预测识别时,输出结果得分
#### 2020.5.30 提供超轻量级中文OCR在线体验
#### 2020.5.30 模型预测、训练支持Windows系统
#### 2020.5.30 开源通用中文OCR模型
#### 2020.5.14 发布[PaddleOCR公开课](https://www.bilibili.com/video/BV1nf4y1U7RX?p=4)
#### 2020.5.14 发布[PaddleOCR实战练习](https://aistudio.baidu.com/aistudio/projectdetail/467229)
#### 2020.5.14 开源8.6M超轻量级中文OCR模型