阿里发布 Qwen3.7-Plus!将视觉理解与界面操作收进智能体基座

阿里千问今天推出 Qwen3.7-Plus,将其定位为视觉与语言统一的多模态交互智能体基座,原因是复杂软件任务不只需要理解指令,也需要识别屏幕并完成操作。该模型保留文本、编码与工具使用能力,加入图像、视频、屏幕和网页输入,可在 GUI、CLI 及工具环境中执行任务,并已接入阿里云百炼与 Qwen Studio。需要处理界面内容、检查画面信息或衔接软件操作时,团队可先判断单一模型能否承接理解与执行,少在视觉模型和操作工具之间来回转交任务。

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容