美团推出 5600 亿参数推理大模型 LongCat-Flash-Thinking,采用混合专家架构,动态激活 186 亿至 313 亿参数。该模型在数学推理、编程等任务表现优异,MATH500 测试中减少 64.5% token 消耗仍保持高准确率。美团已开源模型权重,提供聊天模板和专属网站,支持开发者研究应用。[[官网:https://longcat.chat/]]
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
美团推出 5600 亿参数推理大模型 LongCat-Flash-Thinking,采用混合专家架构,动态激活 186 亿至 313 亿参数。该模型在数学推理、编程等任务表现优异,MATH500 测试中减少 64.5% token 消耗仍保持高准确率。美团已开源模型权重,提供聊天模板和专属网站,支持开发者研究应用。[[官网:https://longcat.chat/]]
暂无评论内容