百度近日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。该模型高效轻量,参数量仅 0.07B,在 CPU 上每秒处理超过 370 个字符。PP-OCRv5 在 OCR 基准测试中超越 Gemini 2.5 Pro、Qwen2.5-VL 和 GPT-4o,支持手写印刷中英文及拼音,识别超过 40 种语言。模型提供精确文本定位,核心组件涵盖图像预处理、文本检测、文本行方向分类和文本识别。[[来源:https://huggingface.co/collections/PaddlePaddle/pp-ocrv5-684a5356aef5b4b1d7b85e4b]]
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容