小米昨日正式开源了首个原生端到端语音大模型 Xiaomi‑MiMo‑Audio,该模型是目前业界少有的端到端语音大模型,凭借大规模训练数据、创新预训练架构以及首次实现的 ICL 少样本泛化,已经在多个公开基准上超越了同类闭源模型。其完整开源的技术栈为学术研究和产业落地提供了重要资源,预计将在智能语音交互、跨模态 AI 等领域产生广泛影响。[[来源:https://huggingface.co/XiaomiMiMo/MiMo-Audio-7B-Instruct]]
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容