开源模型 Mini-o3 突破视觉推理瓶颈!支持数十轮深度分析
字节跳动联合香港大学推出开源视觉推理模型 Mini-o3,实现数十轮复杂视觉分析突破。该模型整合 VisualProbe 数据集与迭代收集流程,运用超轮次掩码策略增强多轮推理能力,显著提升处理图像深层...
Cursor 借强化学习优化 Tab 模型!代码建议接受率提升 28%
Cursor AI 编程平台升级其核心 Tab 自动补全模型,通过强化学习技术优化代码建议机制。模型依据用户反馈实时调整,接受建议获得奖励,被拒则受到惩罚。该改进使建议数量减少 21%,接受率提高 28...
xAI 推出 Grok 4 Fast 模型!响应速度提升 10 倍
马斯克旗下 xAI 公司发布 Grok 4 Fast 模型,该版本以极致响应速度为优先优化目标。它大幅简化复杂任务的处理流程,专注于为用户提供即时、实用的结果,特别适合快速查询等轻量级应用场景。目前...
Genspark 全球首发本地运行开源模型的 AI 浏览器
Genspark 发布全球首款支持本地运行开源模型的 AI 浏览器,允许用户在离线环境下直接调用 169 款模型,涵盖 GPT-OSS 和 Gemma3 等。该浏览器集成端侧大模型与全能智能体,可实时比价、分析评论...
小红书开源 FireRedTTS-2 语音模型!支持多说话人对话与音色克隆
小红书智创音频团队开源新一代对话合成模型 FireRedTTS-2,针对多说话人对话生成优化,显著提升自然度与减少发音错误。该模型支持音色克隆功能,仅凭一句样本即可模仿发音人音色与习惯,合成完...
任天堂发布《超级马里奥兄弟》40 周年专属纪念 LOGO
为庆祝《超级马里奥兄弟》发售 40 周年,任天堂正式发布一款专属纪念 LOGO。该设计巧妙融合像素风格、数字“40”与马里奥标志性元素,致敬这款全球销量超 4000 万套、定义横版动作游戏的经典之...
谷歌 Gemini 应用登顶多地区 App Store 榜单,首次超越 ChatGPT
谷歌 Gemini 应用在美区、印度、加拿大等地苹果应用商店免费榜击败 ChatGPT 登顶。其内置免费图像编辑工具 Nano Banana 推动用户量显著增长,一个月新增 2300 万用户,累计编辑图片超 5 亿张。...
蚂蚁集团发布 AI 开源生态报告,中美开发者贡献超四成核心力量
蚂蚁集团在外滩大会发布《全球大模型开源开发生态全景与趋势报告》2.0 版,收录 114 个重点开源项目,覆盖 AI Agent 与 Infra 等领域。报告显示,中美开发者占全球核心贡献者 42%,中国厂商倾向...
上周热门文章:《 量大管饱!13 个超实用的 Nano Banana 玩法合集!》
刚过去这个一周 Nano Banana 是彻底火了,到处都是香蕉,甚至谷歌自己都没招了,AI Studio 上面名字直接按 Nano Banana 展示了。藏师傅周末这两天也一点没闲着,在周三发完教程之后,又探索出来...
百度推出新一代文字识别 PP-OCRv5 OCR 模型!优化文本识别性能
百度近日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。该模型高效轻量,参数量仅 0.07B,在 CPU 上每秒处理超过 370 个字符。PP-OCRv5 在 OCR 基准测试中超越 Gemini 2.5 Pro、Qwen2....