在 2026 谷歌 I/O 上,Google 正式发布 Gemini Omni,DeepMind 负责人哈萨比斯称它是 Gemini 家族覆盖面最广的版本。模型可处理文字、图像、视频和音频,并用对话指令改动视频角色、背景等元素。首款 Gemini Omni Flash 已进入 Gemini App、Google Flow 和 YouTube Shorts,后续提供 API。这把视频修改从剪辑软件内的多步操作前移到模型对话中,内容团队可先用一句话验证镜头方向,再把结果放进短视频平台或应用服务。API 也给第三方工具留下接入空间,素材处理不必固定在单一应用里完成。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END













暂无评论内容