来源:互联网 更新时间:2026-06-15 13:40
从2020年5月到去年5月,PP-OCR系列从v1一路迭代到v5,凭借极致的速度与精度平衡,早已成为OCR界的顶流——在UmiOCR、MinerU、TurboOCR等业界工具链中,它几乎都是核心引擎;在各大模型团队的数据处理流程里,更是不可或缺的基础设施。团队多年前的一个想法,生根发芽,如今已长成大模型时代的数据引擎。感谢广大开发者持续的反馈,让我们有机会不断迭代。
今天,正式发布PP-OCRv6——文本检测识别任务实现了一次跨越式进步。

PP-OCRv6已上线PaddleOCR官网,用户可通过网页或API快速使用。同时,代码和模型权重已开源至Github和HuggingFace,欢迎下载使用。
PaddleOCR官网:https://paddleocr.com
Github:https://github.com/PaddlePaddle/PaddleOCR
HuggingFace:https://huggingface.co/collections/PaddlePaddle/pp-ocrv6
本文不做技术详解,主要快速传递本次升级的核心能力,后续会再拆解技术细节。


>>>左右滑动查看更多>>>
>>>左右滑动查看更多>>>
>>>左右滑动查看更多>>>
>>>左右滑动查看更多>>>
>>>左右滑动查看更多>>
>>>左右滑动查看更多>>>
>>>左右滑动查看更多>>>
>>>左右滑动查看更多>>>
基于多场景高质量文本检测和识别的In-house评估集,PP-OCRv6在检测和识别两项任务上大幅领先前代。
PP-OCRv6的三档模型几乎全面领先PP-OCRv5,并且断档式领先通用大模型。

同样,PP-OCRv6的三档模型领先PP-OCRv5和通用大模型。

在多款主流硬件测试中,PP-OCRv6全面碾压PP-OCRv5。具体来说,PP-OCRv6_medium在Intel Xeon 8350C CPU上的单图推理时延仅1.4s,是PP-OCRv5_Server的5.2倍。在移动端与边缘端,PP-OCRv6_small在多种推理后端上全方位超越PP-OCRv5_Mobile。而极致轻量化的PP-OCRv6_tiny更惊艳——在Intel Xeon 8350C CPU上耗时缩至0.2s,在本地M4芯片浏览器环境测试常规图片时,端到端延迟甚至只有97ms。这种在各类算力平台上的指数级性能飞跃,无疑是端侧及全栈OCR开发者的福音。

安装飞桨框架与PaddleOCR(3.7.0及以上版本):
python -m pip install paddlepaddle==3.2.1 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
python -m pip install "paddleocr>=3.7.0"
在命令行快速体验PP-OCRv6能力(3.7.0及以上版本的默认PP-OCR模型已切换到v6版本):
paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png
--use_doc_orientation_classify False
--use_doc_unwarping False
--use_textline_orientation False
也可以调用Python API,集成到下游应用中:
from paddleocr import PaddleOCR
ocr = PaddleOCR(
use_doc_orientation_classify=False,
use_doc_unwarping=False,
use_textline_orientation=False,
)
# 指定模型档位
# ocr = PaddleOCR(
# text_detection_model_name="PP-OCRv6_tiny_det",
# text_recognition_model_name="PP-OCRv6_tiny_rec",
# use_doc_orientation_classify=False,
# use_doc_unwarping=False,
# use_textline_orientation=False,
# )
result = ocr.predict("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png")
for res in result:
res.print()
res.sa ve_to_img("output")
res.sa ve_to_json("output")
滑动查看更多
此外,PaddleOCR v3.7版本已广泛兼容onnxruntime、transformers后端,可根据当前环境通过指定engine来切换推理后端。例如使用onnxruntime推理,只需增加参数--engine onnxruntime:
paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png
--use_doc_orientation_classify False
--use_doc_unwarping False
--use_textline_orientation False
--engine onnxruntime
更多端侧部署参考文档:
从2020年到今天,PP-OCR已走过六年征程。从一个团队的想法,成长为业界不可或缺的数据引擎;从实验室的模型,演变为千万开发者手中的利器。技术的价值在于被使用,模型的生命在于被信赖。当PP-OCR出现在越来越多的工具链中,支撑起越来越庞大的数据处理需求,这份信任来之不易,更需倍加珍惜。
未来,PaddleOCR将继续秉持开源开放的初心,与广大开发者同行,持续探索OCR技术的边界,让文字的力量在数字世界中无处不在。感谢每一位使用者、每一条反馈、每一份信任。
让我们一起,用技术点亮文字,用开源照亮未来。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
网络热词聊污是什么意思
帅气继父网名女生可爱英文(精选100个)
抖音最火沙雕男生网名(精选100个)
蒙古上单是什么梗
韦一敏是什么梗
帅到极致的网名女生霸气(精选100个)
免费看电影的软件推荐
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
因空难被判“过失杀人罪” 空客、法航均被顶格处罚22.5万欧元
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
作家助手如何上传自制封面 作家助手如何设置小说的封面
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
有寓意的易经网名男生(精选100个)
韩漫小少爷网名大全女生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc