排序
小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio
小米昨日正式开源了首个原生端到端语音大模型 Xiaomi‑MiMo‑Audio,该模型是目前业界少有的端到端语音大模型,凭借大规模训练数据、创新预训练架构以及首次实现的 ICL 少样本泛化,已经在多个...
腾讯元宝上线微信公众号及视频号评论区!AI 加速内容理解
腾讯云宣布 AI 助手腾讯元宝全面上线微信公众号和视频号评论区,帮助用户高效消化海量内容。用户输入指令“总结一下”,元宝迅速抓取视频或文章重点总结核心信息,支持扩展提问解释网络“梗”和...
Luma 发布全球首个推理视频模型 Ray 3!支持 4K HDR 与草稿模式
昨日 Luma AI 推出全球首个推理视频模型 Ray 3,具备智能推理能力理解用户意图,规划复杂场景提升生成准确性与艺术性。该模型支持草图到 4K 分辨率创作,草稿模式加速生成约 20 倍,原生输出 HD...
小鹏启动史上最大 AI 校招!年薪百万推动群体智能
小鹏汽车在华南理工大学启动 2026 届史上最大规模 AI 人才校招,何小鹏亲自招聘并宣布 AI 算法工程师年薪可达百万。他定位公司为汽车与 AI 双轨企业,预计年研发投入 500 亿元中 300 亿元用于 A...
全球首个 AI 全栈工程师 Orchids 发布!能力超越 Devin 等竞品
全球首个 AI 全栈工程师 Orchids 正式发布,其 UI 设计与全栈能力领先业界,在 UI Bench 和 Design Arena 排名第一,超越 Devin、Cursor 等产品。Orchids 独立实现前端、后端、认证、数据库及支...
Gamma 3.0 颠覆 PPT 制作流程!AI 十分钟生成 30 页演示稿
Gamma 3.0 升级为视觉叙事平台,推出智能助手 Gamma Agent 实现 AI 联动创作:用户上传表格图片可自动还原数据并排版,输入需求即联网搜索内容生成图文;同步优化视觉效果,智能布局主动推荐图...
抖音上线 AI 求真功能!大模型实现谣言快速识别
抖音近日推出 AI 求真功能,用户浏览易误解内容或搜索谣言时点击求真卡获取事件溯源、澄清信息及权威报道。该功能应用大模型技术提取视频信息、分析主旨、联网搜索风险,自动处置谣言内容,成功...
法国 AI 公司 Mistral 重磅推出开源推理模型 Magistral Small 1.2
法国公司 Mistral AI 推出了其最新开源推理模型 Magistral Small 1.2,该模型拥有 24B 参数,并以 Apache2.0 开源许可方式发布。新版本支持高达 128k 的上下文处理,引入了 THINK 特殊 token,...
Suno v5 音乐模型即将登场!AI 音乐创作迎来“变革性”升级
Suno 官方发布 v5 音乐模型预告视频,15 秒短片展示抽象音符与光影,配以低沉电子旋律,引发全球热议,浏览量超 10 万次并积累数千条讨论。新模型可能本月或年底前亮相,预期引入更先进语义控制...
腾讯混元新技术给大模型 “去油”!让 AI 生成图像更真实
腾讯混元团队与香港中文大学(深圳)及清华大学合作,推出了 SRPO 技术,旨在提升 AI 生成图像的真实感,解决 Flux 模型在人物皮肤质感上的问题。该技术引入了“语义相对偏好优化”策略,并采用...


