排序
B 站开源 IndexTTS-2.0 语音合成 AI 模型!首创精准时长控制 TTS
Bilibili 推出 IndexTTS-2.0 语音生成模型,开源首个支持精准时长控制的自回归零样本 TTS 系统。该模型提升视频配音同步性,提供精确时长或自由生成两种模式。用户独立指定音色和情绪来源,整合...
DeepSeek-R1 论文登《Nature》封面!开创 AI 科学检验先例
DeepSeek 的大型语言模型 DeepSeek-R1 研究成果登上国际顶尖期刊《Nature》封面。该模型仅花费 29.4 万美元训练,运用纯强化学习激发推理能力,在 AIME 2024 数学竞赛中取得 77.9% 准确率。Deep...
通义实验室发布 AgentScope 1.0!简化智能体开发
通义实验室推出新一代智能体开发框架 AgentScope 1.0,助力开发更简单安全。该开源框架采用三层架构:核心框架实现模块化扩展,Runtime 提供安全沙箱和部署引擎,Studio 支持监控评测。框架强化...
阿联酋推出全球最快开源 AI 模型 K2 Think!参数达 320 亿
阿联酋穆罕默德・本・扎耶德人工智能大学与 G42AI 联合发布开源大语言模型 K2 Think,该模型具备 320 亿参数,每秒生成 2000 个 tokens,创全球最快记录。它在复杂数学、编程和科学基准测试中表...
夸克发布全阶段医师考试 AI 测试集!推动医疗大模型标准化
近日夸克推出国内首个覆盖执业医师至主任医师全阶段的 AI 测试集,包含 7600 余道 2024 年真题。该测试集采用分级设计:初级侧重单选记忆题,高级增加案例分析题,精准评估模型推理能力。解决医...
上周热门文章:《 超多案例!谷歌 AI 模型 Nano Banana 的 5 个实用+趣味玩法 》
嗨大家好!我是阿真!Nano Banana我之前预告过说要写,今天终于写完了。Nano Banana就是现在谷歌的gemini-2.5-flash-image-preview(看你这么厉害,后续就晋升缩写为NB吧),确实是很不错,我尝...
Raycast 集成 Cursor Agent 插件!大幅提升 AI 编程开发效率
Raycast 推出 Cursor Agent 插件,将 Cursor AI 功能整合进快捷启动器。开发者可直接启动 Cursor AI 代理编辑运行代码,实时查看运行状态,发送后续指令或手动接管任务。该插件减少工具切换,支...
微软发布 Live Interpreter API 实现实时跨语言翻译
微软推出 Live Interpreter API,为 Azure Speech Translation 提供实时多语言翻译能力。支持 76 种语言和 143 个地区,用户无需设置输入语言即可实现流畅沟通,自动识别语言,降低延迟,接近人...
快手推出 Kwali AI 视频生成工具!一句话快速创建短视频
快手近期内测 AIGC 视频制作工具 Kwali。用户通过文字描述需求,该工具可快速生成包含脚本、画面和音乐的完整短视频。它整合多 Agent 框架与海量素材库,大幅降低视频制作门槛,助力商家与创作...
华纳兄弟起诉 Midjourney 侵犯蝙蝠侠、超人、兔八哥等角色版权
华纳兄弟在美国洛杉矶联邦法院起诉 AI 平台 Midjourney,指控其未经授权使用超人、蝙蝠侠等角色训练 AI 模型,生成侵权图像和视频。华纳声称 Midjourney 明知侵权却缺乏保护,上月取消限制生成...

