阿里发布 Qwen3.7-Plus！将视觉理解与界面操作收进智能体基座

Adminser

昨天发布

03415

阿里千问今天推出 Qwen3.7-Plus，将其定位为视觉与语言统一的多模态交互智能体基座，原因是复杂软件任务不只需要理解指令，也需要识别屏幕并完成操作。该模型保留文本、编码与工具使用能力，加入图像、视频、屏幕和网页输入，可在 GUI、CLI 及工具环境中执行任务，并已接入阿里云百炼与 Qwen Studio。需要处理界面内容、检查画面信息或衔接软件操作时，团队可先判断单一模型能否承接理解与执行，少在视觉模型和操作工具之间来回转交任务。

文章版权归作者所有，未经允许请勿转载。

THE END

新晨报

喜欢就支持一下吧

请登录后发表评论

登录注册

暂无评论内容