更新

  • 2020.12.15 更新数据合成工具Style-Text,可以批量合成大量与目标场景类似的图像,在多个场景验证,效果明显提升。
  • 2020.12.07 FAQ新增5个高频问题,总数124个,并且计划以后每周一都会更新,欢迎大家持续关注。
  • 2020.11.25 更新半自动标注工具PPOCRLabel,辅助开发者高效完成标注任务,输出格式与PP-OCR训练任务完美衔接。
  • 2020.9.22 更新PP-OCR技术文章,https://arxiv.org/abs/2009.09941
  • 2020.9.19 更新超轻量压缩ppocr_mobile_slim系列模型,整体模型3.5M(详见PP-OCR Pipline),适合在移动端部署使用。
  • 2020.9.17 更新超轻量ppocr_mobile系列和通用ppocr_server系列中英文ocr模型,媲美商业效果。
  • 2020.9.17 更新英文识别模型多语种识别模型,已支持德语、法语、日语、韩语,更多语种识别模型将持续更新。
  • 2020.8.26 更新OCR相关的84个常见问题及解答,具体参考FAQ
  • 2020.8.24 支持通过whl包安装使用PaddleOCR,具体参考Paddleocr Package使用说明
  • 2020.8.21 更新8月18日B站直播课回放和PPT,课节2,易学易用的OCR工具大礼包,获取地址
  • 2020.8.16 开源文本检测算法SAST和文本识别算法SRN
  • 2020.7.23 发布7月21日B站直播课回放和PPT,课节1,PaddleOCR开源大礼包全面解读,获取地址
  • 2020.7.15 添加基于EasyEdge和Paddle-Lite的移动端DEMO,支持iOS和Android系统
  • 2020.7.15 完善预测部署,添加基于C++预测引擎推理、服务化部署和端侧部署方案,以及超轻量级中文OCR模型预测耗时Benchmark
  • 2020.7.15 整理OCR相关数据集、常用数据标注以及合成工具
  • 2020.7.9 添加支持空格的识别模型,识别效果,预测及训练方式请参考快速开始和文本识别训练相关文档
  • 2020.7.9 添加数据增强、学习率衰减策略,具体参考配置文件
  • 2020.6.8 添加数据集,并保持持续更新
  • 2020.6.5 支持 attetnion 模型导出 inference_model
  • 2020.6.5 支持单独预测识别时,输出结果得分
  • 2020.5.30 提供超轻量级中文OCR在线体验
  • 2020.5.30 模型预测、训练支持Windows系统
  • 2020.5.30 开源通用中文OCR模型
  • 2020.5.14 发布PaddleOCR公开课
  • 2020.5.14 发布PaddleOCR实战练习
  • 2020.5.14 开源8.6M超轻量级中文OCR模型