兔展智能与北京大学联合推出 UniWorld-V2 图像编辑模型,它能精准响应中文指令,支持通过框选区域进行精细编辑,效果自然融合。该模型基于创新的 UniWorld-R1 视觉强化学习框架,有效避免了数据过拟合问题。在 GEdit-Bench 和 ImgEdit 两大权威基准测试中,其得分 7.83 和 4.49 均显著优于 GPT-Image-1 等模型。[[来源:https://github.com/PKU-YuanGroup/UniWorld]]
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END







暂无评论内容