B 站开源 IndexTTS-2.0 语音合成 AI 模型!首创精准时长控制 TTS

Bilibili 推出 IndexTTS-2.0 语音生成模型,开源首个支持精准时长控制的自回归零样本 TTS 系统。该模型提升视频配音同步性,提供精确时长或自由生成两种模式。用户独立指定音色和情绪来源,整合 GPT 表示增强清晰度。支持自然语言控制情绪,性能超越先进模型。团队计划公开代码和预训练权重。[[来源:https://github.com/index-tts/index-tts]]

© 版权声明
THE END
喜欢就支持一下吧
点赞7赞赏 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容