英伟达昨日发布 Cosmos 3,并选择开放面向物理 AI 的全套模型,原因在于机器人、自动驾驶等任务长期受限于数据分散与仿真泛化不足。该模型在单一系统中结合视觉推理、世界生成和动作预测,可理解文本、图像、视频、音效及动作轨迹,并推出适配训练、快速解析与边缘推理的不同版本。视频团队可借其测试运动与空间关系,开发团队也能在开源基础上训练专用方案,把物理场景验证前移到产品落地之前。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END

英伟达昨日发布 Cosmos 3,并选择开放面向物理 AI 的全套模型,原因在于机器人、自动驾驶等任务长期受限于数据分散与仿真泛化不足。该模型在单一系统中结合视觉推理、世界生成和动作预测,可理解文本、图像、视频、音效及动作轨迹,并推出适配训练、快速解析与边缘推理的不同版本。视频团队可借其测试运动与空间关系,开发团队也能在开源基础上训练专用方案,把物理场景验证前移到产品落地之前。
暂无评论内容