字节跳动昨日开源多模态 AI 模型 Lance,激活参数量 3B。它没有把理解和生成拆成多个模块,而是从训练阶段统一图像、视频理解、生成与跨模态编辑。模型用共享上下文配合双流专家架构,并结合 Qwen2.5-VL、Wan2.2 和 MaPE 处理语义、纹理与时序边界。对需要比较多模态工具的人来说,Lance 提供了轻量模型同时处理看图、看视频和生成任务的新参照。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END

字节跳动昨日开源多模态 AI 模型 Lance,激活参数量 3B。它没有把理解和生成拆成多个模块,而是从训练阶段统一图像、视频理解、生成与跨模态编辑。模型用共享上下文配合双流专家架构,并结合 Qwen2.5-VL、Wan2.2 和 MaPE 处理语义、纹理与时序边界。对需要比较多模态工具的人来说,Lance 提供了轻量模型同时处理看图、看视频和生成任务的新参照。
暂无评论内容