面壁智能联合清华大学和 OpenBMB 开源 ForgeTrain,称其为首个完全由 AI 编写、零人类代码介入的生产级大模型训练框架。团队已用它在华为昇腾芯片上完成 MiniCPM5-1B 预训练,并拿到 2B 以下 AA 榜单 Top 1。随框架同步放出的 Agent Harness 包含测试规约和智能体编排方案,其他团队可复现从代码生成到模型训练的关键步骤。[[来源:https://github.com/OpenBMB/ForgeTrain]]
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END












暂无评论内容