小红书智创音频团队开源新一代对话合成模型 FireRedTTS-2,针对多说话人对话生成优化,显著提升自然度与减少发音错误。该模型支持音色克隆功能,仅凭一句样本即可模仿发音人音色与习惯,合成完整对话,同时具备多语言训练和高效语音编码能力,推动 AI 播客制作进入更实用阶段。[[来源:https://github.com/FireRedTeam/FireRedTTS2]]
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
小红书智创音频团队开源新一代对话合成模型 FireRedTTS-2,针对多说话人对话生成优化,显著提升自然度与减少发音错误。该模型支持音色克隆功能,仅凭一句样本即可模仿发音人音色与习惯,合成完整对话,同时具备多语言训练和高效语音编码能力,推动 AI 播客制作进入更实用阶段。[[来源:https://github.com/FireRedTeam/FireRedTTS2]]
暂无评论内容