小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio

月色诗人

21天前发布

0417

小米昨日正式开源了首个原生端到端语音大模型 Xiaomi‑MiMo‑Audio，该模型是目前业界少有的端到端语音大模型，凭借大规模训练数据、创新预训练架构以及首次实现的 ICL 少样本泛化，已经在多个公开基准上超越了同类闭源模型。其完整开源的技术栈为学术研究和产业落地提供了重要资源，预计将在智能语音交互、跨模态 AI 等领域产生广泛影响。[[来源:https://huggingface.co/XiaomiMiMo/MiMo-Audio-7B-Instruct]]

文章版权归作者所有，未经允许请勿转载。

THE END

副业指南

喜欢就支持一下吧

请登录后发表评论

登录注册

暂无评论内容