开源模型 Mini-o3 突破视觉推理瓶颈!支持数十轮深度分析

字节跳动联合香港大学推出开源视觉推理模型 Mini-o3,实现数十轮复杂视觉分析突破。该模型整合 VisualProbe 数据集与迭代收集流程,运用超轮次掩码策略增强多轮推理能力,显著提升处理图像深层问题的效率,为视觉 AI 技术开辟新路径。[[来源:https://arxiv.org/pdf/2509.07969]]

© 版权声明
THE END
喜欢就支持一下吧
点赞8赞赏 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容