豆包输入法登陆小米商店,同源 AI 语音技术赋能高效交互
豆包输入法正式亮相小米应用商店,虽暂处维护状态,其搭载的豆包 App 同源语音技术已成焦点。产品支持方言、中英混合及轻声输入,配合点击与长按双模式灵活切换。通过内置剪贴板、即时翻译及全...
OpenAI 发布 GPT-5.1 Pro 强化推理能力,正面对标 Gemini 3
OpenAI 近日正式推出 GPT-5.1 Pro,新模型在情商与智商双维度实现显著提升,现已向所有 Pro 用户开放。官方强调,该版本在处理复杂任务时展现出更清晰的推理逻辑和更强大的表达能力,写作辅助、...
月之暗面融资冲刺 40 亿美元估值!长文本技术筑基明年 IPO
《华尔街日报》披露月之暗面推进新一轮融资,潜在投资方包括 IDG 资本与腾讯,目标估值约 40 亿美元,计划年底完成并于明年下半年启动 IPO 。公司依托长文本分析优势,近期开源 Kimi K2 Thinkin...
华为 Flex:ai 深度融合软硬件!算力切分将利用率翻倍至 70%
华为发布 AI 容器软件 Flex:ai,利用算力切分技术将 GPU / NPU 细分为最小 10% 的虚拟单元,并聚合空闲资源构建共享算力池。该软件深度融合底层芯片与顶层调度,支持单卡多负载运行,成功将硬件...
电信华为试点 5G 机械导盲犬!云网融合破解视障出行难题
中国电信联合华为、鼎桥在上海成功试点 5G 机械导盲犬方案,利用网络内生智能与边缘云技术填补视障辅助缺口。该方案依托 20Mbps 大上行速率,支持激光雷达与高清摄像头数据实时回传,通过将计算...
Meta 发布 WorldGen:单指令生成 50 米全纹理可交互 3D 场景
Meta 近日推出端到端系统 WorldGen,仅凭单条文本提示即可自动构建 50 米 × 50 米全纹理 3D 场景。该技术融合程序化逻辑与扩散模型,突破单一视角限制,实现场景全局风格与几何结构高度统一。...
上周热门文章:《 Gemini 3 重磅发布,我连夜整理了 3 大核心亮点与 5 种免费用方法!》
谷歌重磅发布 Gemini 3,新模型视觉与编码能力迎来质变。它不仅精准识别手写字迹与高帧率视频,更能一键生成 3D 游戏并像素级复刻网站。其智能体功能亦实现全自主工作流接管,可自动处理邮件与...
蚂蚁集团发布全模态 AI 助手灵光 App !人人都能 30 秒生成小应用
蚂蚁集团正式发布全模态 AI 助手“灵光” App,现已上架主流应用商店。其核心“灵光闪应用”功能支持用户用一句话,在 30 秒内生成如旅行规划器、成本计算器等可交互小应用。同时,App 提供结构...
JetBrains 开源 DPAI Arena!树立 AI 编码生产力评测新标杆
针对当前 AI 编码评测标准的局限,JetBrains 发布了业界首个开放式基准平台 DPAI Arena。它采用灵活架构,可对多语言、多工作流的真实软件工程任务进行公平、可复现的比较,有效衡量 AI 编码智...
Gemini Veo 3.1 突破!三图精准合成高品质连贯视频
谷歌向 Gemini Pro/Ultra 订阅用户推送 Veo 3.1 视频模型。其全新的 “Ingredients to Video” 模式支持同时上传人物、场景、风格三张参考图,系统会分别提取并融合这些核心元素,生成一段 8 秒...



