谷歌发布 Gemini Omni！任意输入输出让视频修改收进创意指令

Adminser

4小时前发布

0319

在 2026 谷歌 I/O 上，Google 正式发布 Gemini Omni，DeepMind 负责人哈萨比斯称它是 Gemini 家族覆盖面最广的版本。模型可处理文字、图像、视频和音频，并用对话指令改动视频角色、背景等元素。首款 Gemini Omni Flash 已进入 Gemini App、Google Flow 和 YouTube Shorts，后续提供 API。这把视频修改从剪辑软件内的多步操作前移到模型对话中，内容团队可先用一句话验证镜头方向，再把结果放进短视频平台或应用服务。API 也给第三方工具留下接入空间，素材处理不必固定在单一应用里完成。

文章版权归作者所有，未经允许请勿转载。

THE END

新晨报

喜欢就支持一下吧

请登录后发表评论

登录注册

暂无评论内容