Ideogram 4.0 开源生图模型!海报封面电商主图文字排版可控

Ideogram 近日发布 Ideogram 4.0 开放权重文生图模型,核心规模 9.3B 参数,采用单流架构,把文本与图像 token 放进同一自注意力序列,设计控制被放到训练和推理格式中心。它加入对象和文字边界框、结构化 JSON 字幕数据,让提示词能约束文字位置、版式和对象关系。DesignArena 排名显示其超过 Nano Banana Pro,位列全球第 4。过去依赖闭源生图服务的海报、商品图、封面制作,现在多了可下载评估的方案,长文字呈现和排版可控性也有公开参照。

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容