排序
小红书开源 FireRedTTS-2 语音模型!支持多说话人对话与音色克隆
小红书智创音频团队开源新一代对话合成模型 FireRedTTS-2,针对多说话人对话生成优化,显著提升自然度与减少发音错误。该模型支持音色克隆功能,仅凭一句样本即可模仿发音人音色与习惯,合成完...
苹果开源 FastVLM 与 MobileCLIP2!赋能 iPhone AI 应用
苹果在 Hugging Face 平台开源 FastVLM 和 MobileCLIP2 视觉语言模型。FastVLM 优化高分辨率图像处理,提升速度 85 倍。MobileCLIP2 实现高效图像文本对齐,适配边缘设备。两款模型支持实时视频...
Anthropic 推出 Claude AI 新功能!自动记忆聊天内容
Anthropic 为 Claude AI 推出了新功能,允许团队和企业用户的聊天记录自动记忆,提升工作效率。该功能不仅限于聊天记录,还能延续到项目中,用户可生成图表、网站设计等内容。同时,新增隐身聊...
美团首款 AI 生活助手「小美」公测上线!集成核心业务服务
美团宣布首款生活助手 AI Agent App「小美」正式上线公测。该 App 在 iOS 和 Android 平台同步推出,用户下载输入公测暗号「DAYONE」开启试用。「小美」搭载自研模型 LongCat-Flash-Chat,全面...
MiniMax 发布新一代 Music1.5 模型!音乐生成时长增至 4 分钟
MiniMax 推出新一代音乐生成模型 Music1.5,将生成音乐时长提升至 4 分钟。该模型突破性地增强控制力,用户输入自然语言描述即可创作高完成度作品。支持多种声线和唱腔,编曲层次丰富,建模乐器...

