面壁智能联合清华大学、OpenBMB 开源社区发布 BitCPM-CANN,这是中国首个基于华为昇腾平台训练的 1.58-bit 三值大模型。团队选择低比特路线,是为了在训练、推理和部署环节压缩资源占用,同时保持同尺寸模型性能。模型权重已开源,使用 AI 工具的人可在国产算力环境中测试轻量模型,评估私有化知识库和内部应用的接入方案。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END

面壁智能联合清华大学、OpenBMB 开源社区发布 BitCPM-CANN,这是中国首个基于华为昇腾平台训练的 1.58-bit 三值大模型。团队选择低比特路线,是为了在训练、推理和部署环节压缩资源占用,同时保持同尺寸模型性能。模型权重已开源,使用 AI 工具的人可在国产算力环境中测试轻量模型,评估私有化知识库和内部应用的接入方案。
暂无评论内容