谷歌在 2026 I/O 开发者大会发布 Gemini Omni,把理解、生成、编辑能力整合至统一世界模型。该架构解决行业模型拆分带来的画面漂移、逻辑断裂等问题,可识别各类输入元素的物理关联,还能长效保留角色与场景特征。使用者可文字指令修改视频画面,盘活硬盘闲置废片,小体量内容团队也能持续产出系列剧情内容。轻量版本已接入谷歌全系应用,生成视频附带隐形数字水印。[[全文:https://mp.weixin.qq.com/s/7S1elKXmc-Tz6DIPRdIc6A]]
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END











暂无评论内容