Bilibili 推出 IndexTTS-2.0 语音生成模型,开源首个支持精准时长控制的自回归零样本 TTS 系统。该模型提升视频配音同步性,提供精确时长或自由生成两种模式。用户独立指定音色和情绪来源,整合 GPT 表示增强清晰度。支持自然语言控制情绪,性能超越先进模型。团队计划公开代码和预训练权重。[[来源:https://github.com/index-tts/index-tts]]
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
Bilibili 推出 IndexTTS-2.0 语音生成模型,开源首个支持精准时长控制的自回归零样本 TTS 系统。该模型提升视频配音同步性,提供精确时长或自由生成两种模式。用户独立指定音色和情绪来源,整合 GPT 表示增强清晰度。支持自然语言控制情绪,性能超越先进模型。团队计划公开代码和预训练权重。[[来源:https://github.com/index-tts/index-tts]]
暂无评论内容