2025年09月的文章 第12页
腾讯混元 3D Studio 上线!创作效率跃升分钟级
腾讯推出混元 3D Studio,专为 3D 设计师、游戏开发者和建模师打造 AI 工作台,整合概念设计、几何建模、贴图、蒙皮和动画制作全链路流程,将 3D 资产生产周期从“天”缩短至“分钟”级。平台引...
面壁智能联合清华发布 VoxCPM 语音模型!支持零样本克隆
面壁智能与清华大学联合推出高拟真语音生成模型 VoxCPM,支持零样本声音克隆功能。该模型以 0.5B 参数实现行业领先的自然度与音色相似度,仅需极少数据即可生成用户独特声音。VoxCPM 在 Seed-TT...
阿里云开源动作生成模型 Wan2.2-Animate 升级创意工具
阿里云宣布开源通义万相动作生成模型 Wan2.2-Animate,助力短视频、舞蹈和动漫制作。该模型升级自 Animate Anyone,大幅提升人物一致性与生成质量,支持动作模仿和角色扮演两种模式:输入角色图...
小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio
小米昨日正式开源了首个原生端到端语音大模型 Xiaomi‑MiMo‑Audio,该模型是目前业界少有的端到端语音大模型,凭借大规模训练数据、创新预训练架构以及首次实现的 ICL 少样本泛化,已经在多个...
腾讯元宝上线微信公众号及视频号评论区!AI 加速内容理解
腾讯云宣布 AI 助手腾讯元宝全面上线微信公众号和视频号评论区,帮助用户高效消化海量内容。用户输入指令“总结一下”,元宝迅速抓取视频或文章重点总结核心信息,支持扩展提问解释网络“梗”和...
Luma 发布全球首个推理视频模型 Ray 3!支持 4K HDR 与草稿模式
昨日 Luma AI 推出全球首个推理视频模型 Ray 3,具备智能推理能力理解用户意图,规划复杂场景提升生成准确性与艺术性。该模型支持草图到 4K 分辨率创作,草稿模式加速生成约 20 倍,原生输出 HD...
小鹏启动史上最大 AI 校招!年薪百万推动群体智能
小鹏汽车在华南理工大学启动 2026 届史上最大规模 AI 人才校招,何小鹏亲自招聘并宣布 AI 算法工程师年薪可达百万。他定位公司为汽车与 AI 双轨企业,预计年研发投入 500 亿元中 300 亿元用于 A...
全球首个 AI 全栈工程师 Orchids 发布!能力超越 Devin 等竞品
全球首个 AI 全栈工程师 Orchids 正式发布,其 UI 设计与全栈能力领先业界,在 UI Bench 和 Design Arena 排名第一,超越 Devin、Cursor 等产品。Orchids 独立实现前端、后端、认证、数据库及支...
Gamma 3.0 颠覆 PPT 制作流程!AI 十分钟生成 30 页演示稿
Gamma 3.0 升级为视觉叙事平台,推出智能助手 Gamma Agent 实现 AI 联动创作:用户上传表格图片可自动还原数据并排版,输入需求即联网搜索内容生成图文;同步优化视觉效果,智能布局主动推荐图...
抖音上线 AI 求真功能!大模型实现谣言快速识别
抖音近日推出 AI 求真功能,用户浏览易误解内容或搜索谣言时点击求真卡获取事件溯源、澄清信息及权威报道。该功能应用大模型技术提取视频信息、分析主旨、联网搜索风险,自动处置谣言内容,成功...