小红书开源 FireRedTTS-2 语音模型!支持多说话人对话与音色克隆

小红书智创音频团队开源新一代对话合成模型 FireRedTTS-2,针对多说话人对话生成优化,显著提升自然度与减少发音错误。该模型支持音色克隆功能,仅凭一句样本即可模仿发音人音色与习惯,合成完整对话,同时具备多语言训练和高效语音编码能力,推动 AI 播客制作进入更实用阶段。[[来源:https://github.com/FireRedTeam/FireRedTTS2]]

© 版权声明
THE END
喜欢就支持一下吧
点赞9赞赏 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容