B 站开源 IndexTTS-2.0 语音合成 AI 模型！首创精准时长控制 TTS

Adminser

9个月前发布

0447

Bilibili 推出 IndexTTS-2.0 语音生成模型，开源首个支持精准时长控制的自回归零样本 TTS 系统。该模型提升视频配音同步性，提供精确时长或自由生成两种模式。用户独立指定音色和情绪来源，整合 GPT 表示增强清晰度。支持自然语言控制情绪，性能超越先进模型。团队计划公开代码和预训练权重。[[来源:https://github.com/index-tts/index-tts]]

文章版权归作者所有，未经允许请勿转载。

THE END

学习技术

喜欢就支持一下吧

请登录后发表评论

登录注册

暂无评论内容