微软推出 GPT-realtime 模型!支持图像输入与逼真语音合成
微软在 Azure AI Foundry 平台发布 GPT-realtime 语音转语音模型。该模型在语音技术方面进行了多项改进,包括自然语言处理、音频质量以及精准的指令跟随能力。开发者借助实时 API 体验自然语音...
蚂蚁集团发布全球首个智能眼镜可信连接框架 gPass
蚂蚁集团在 2025 Inclusion 外滩大会上推出全球首个智能眼镜可信连接技术框架 gPass。此框架解决 AI 眼镜行业硬件标准分散、生态不统一等问题,开放安全能力确保设备与信息传输安全,集成无感核...
谷歌 Gemini 新增 URL Context 功能,AI 可深度解析网页及文档
谷歌 Gemini API 上线 URL Context 功能,支持开发者通过链接读取网页、PDF 等文件完整内容。该功能可解析 34MB 以内的文档表格、图片等多模态数据,替代传统 RAG 复杂流程。Thomas Reid 测试证...
支付宝发布 AI 就业助手「晓叶」提升招聘求职效能
支付宝在外滩大会发布 AI 就业助手“晓叶”,运用人工智能大模型与数字人技术革新就业服务。该助手具备四大核心功能:智能匹配连接 1200 万岗位精准对接求职者需求;提供免等待远程 AI 面试并快...








