排序
Gemini Veo 3.1 突破!三图精准合成高品质连贯视频
谷歌向 Gemini Pro/Ultra 订阅用户推送 Veo 3.1 视频模型。其全新的 “Ingredients to Video” 模式支持同时上传人物、场景、风格三张参考图,系统会分别提取并融合这些核心元素,生成一段 8 秒...
小米 AI 修图新突破!自然语言驱动全局多模态交互
小米近日更新超级小爱至 v7.8.50 版本,正式上线“随心修图”功能。用户现在能通过简单的自然语言指令,直接调用相册 AI 大模型完成专业级修图。这项新功能支持全局多模态交互,可精准识别屏幕...
任天堂发布《超级马里奥兄弟》40 周年专属纪念 LOGO
为庆祝《超级马里奥兄弟》发售 40 周年,任天堂正式发布一款专属纪念 LOGO。该设计巧妙融合像素风格、数字“40”与马里奥标志性元素,致敬这款全球销量超 4000 万套、定义横版动作游戏的经典之...
B 站开源 IndexTTS-2.0 语音合成 AI 模型!首创精准时长控制 TTS
Bilibili 推出 IndexTTS-2.0 语音生成模型,开源首个支持精准时长控制的自回归零样本 TTS 系统。该模型提升视频配音同步性,提供精确时长或自由生成两种模式。用户独立指定音色和情绪来源,整合...
阿里云通义千问赋能双 11!创下单日 14 亿次翻译纪录
今年双 11,阿里云全栈 AI 体系迎来首次大规模实战。通义千问大模型深度参与商品出海场景,单日翻译调用量突破 14 亿次,延迟降低 40%。AI 亦优化核心业务性能超 30%,并帮助商家每日节省约 200...
小米发布智能家居 AI 大模型 Miloco!重塑全屋智能交互
小米正式发布智能家居方案 Xiaomi Miloco,其核心为自研 7B 端侧视觉语言大模型。该模型让设备具备“感知+理解”能力,用户通过自然语言即可驱动复杂的场景联动。所有视觉数据均在本地处理,有...
Character AI 联手耶鲁推出 Ovi!重塑音画同步视频生成
Character AI 与耶鲁大学合作发布 Ovi 技术,攻克了传统视频生成的音画不同步难题。该技术运用创新的双骨干交叉模态融合架构,驱动音频与视频流实时互动,确保两者完美对齐。依托高质量数据集,...
WordPress 推出 AI 网站建设工具 Telex!简化网站构建
在 WordCamp US 2025 大会上,WordPress 创始人 Matt Mullenweg 推出 AI 开发工具 Telex。用户输入简单提示,Telex 便能生成内容块并打包下载,直接安装使用。该工具降低技术门槛,使建站更直观...
月之暗面升级 Kimi K2!上下文扩至 256K,高速 API 推出
月之暗面(Moonshot AI)昨日发布 Kimi K2 模型最新版 0905。新版本提升编程能力,优化 Agentic Coding 表现,改进前端体验。上下文长度扩展至 256K,支持复杂任务。推出高速 API,输出速度达 6...
蚂蚁集团发布全球首个智能眼镜可信连接框架 gPass
蚂蚁集团在 2025 Inclusion 外滩大会上推出全球首个智能眼镜可信连接技术框架 gPass。此框架解决 AI 眼镜行业硬件标准分散、生态不统一等问题,开放安全能力确保设备与信息传输安全,集成无感核...

