微软推出 GPT-realtime 模型!支持图像输入与逼真语音合成

微软在 Azure AI Foundry 平台发布 GPT-realtime 语音转语音模型。该模型在语音技术方面进行了多项改进,包括自然语言处理、音频质量以及精准的指令跟随能力。开发者借助实时 API 体验自然语音输出和高品质音频,新增 Marin 及 Cedar 语音风格提升逼真度。价格相比之前的预览版本降低了20%,按每百万代 token 计费。

© 版权声明
THE END
喜欢就支持一下吧
点赞13赞赏 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容