新浪微博开源发布首个 1.5B 模型!性能超越 400 倍参数对手

新浪微博发布首个开源模型 VibeThinker-1.5B。该模型仅 15 亿参数,凭借创新的“频谱到信号原理” (SSP) 训练,在多个高难度数学和编程测试中,表现超越参数量 400 倍的对手,并追平数十倍大的模型。其后训练成本不到 8000 美元,为资源有限的团队开辟了高性价比的研发新路径。[[来源:https://github.com/WeiboAI/VibeThinker]]

© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容