百度推出新一代文字识别 PP-OCRv5 OCR 模型!优化文本识别性能

百度近日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。该模型高效轻量,参数量仅 0.07B,在 CPU 上每秒处理超过 370 个字符。PP-OCRv5 在 OCR 基准测试中超越 Gemini 2.5 Pro、Qwen2.5-VL 和 GPT-4o,支持手写印刷中英文及拼音,识别超过 40 种语言。模型提供精确文本定位,核心组件涵盖图像预处理、文本检测、文本行方向分类和文本识别。[[来源:https://huggingface.co/collections/PaddlePaddle/pp-ocrv5-684a5356aef5b4b1d7b85e4b]]

© 版权声明
THE END
喜欢就支持一下吧
点赞10赞赏 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容