面壁清华发布 BitCPM-CANN!低比特开源模型降低昇腾接入门槛

面壁智能联合清华大学、OpenBMB 开源社区发布 BitCPM-CANN,这是中国首个基于华为昇腾平台训练的 1.58-bit 三值大模型。团队选择低比特路线,是为了在训练、推理和部署环节压缩资源占用,同时保持同尺寸模型性能。模型权重已开源,使用 AI 工具的人可在国产算力环境中测试轻量模型,评估私有化知识库和内部应用的接入方案。

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容