微软推出 GPT-realtime 模型！支持图像输入与逼真语音合成

Adminser

10个月前发布

02813

微软在 Azure AI Foundry 平台发布 GPT-realtime 语音转语音模型。该模型在语音技术方面进行了多项改进，包括自然语言处理、音频质量以及精准的指令跟随能力。开发者借助实时 API 体验自然语音输出和高品质音频，新增 Marin 及 Cedar 语音风格提升逼真度。价格相比之前的预览版本降低了20%，按每百万代 token 计费。

文章版权归作者所有，未经允许请勿转载。

THE END

学习技术

喜欢就支持一下吧

请登录后发表评论

登录注册

暂无评论内容