排序
通义实验室发布 AgentScope 1.0!简化智能体开发
通义实验室推出新一代智能体开发框架 AgentScope 1.0,助力开发更简单安全。该开源框架采用三层架构:核心框架实现模块化扩展,Runtime 提供安全沙箱和部署引擎,Studio 支持监控评测。框架强化...
谷歌 Gemini 新增 URL Context 功能,AI 可深度解析网页及文档
谷歌 Gemini API 上线 URL Context 功能,支持开发者通过链接读取网页、PDF 等文件完整内容。该功能可解析 34MB 以内的文档表格、图片等多模态数据,替代传统 RAG 复杂流程。Thomas Reid 测试证...
挑战行业标杆!苹果推出 STARFlow 图像生成技术
苹果公司发布全新 AI 图像生成系统 STARFlow,融合正则化流与自回归变换器技术。该系统突破高分辨率图像生成瓶颈,优化深浅设计并操控潜在空间,显著提升图像效率与质量。苹果联合学术机构推动...
微软 Copilot 实验室推出文本转语音工具!支持情感风格定制
微软推出实验性平台 Copilot Labs,首发工具“音频表达”支持文本转语音功能。该工具基于最新语音模型,用户可自由调整音频情感、语调及风格,适配故事讲述与演讲等场景。提供情感模式和故事模...
CoMPaSS-FLUX.1 模型震撼登场!大幅改进 Flux 图像生成的空间关系理解
研究团队推出 CoMPaSS-FLUX.1 模型,基于 FLUX.1 的 LoRA 适配器。该模型优化文本到图像空间关系理解,提升生成图像的物体排列准确性。VISOR 基准测试相对提升 98%,T2I - CompBench 空间测试提...
美团开源 560B 参数 AI 大模型 LongCat-Flash!年投超百亿布局生态
美团发布并开源 5600 亿参数混合专家模型 LongCat-Flash,采用 MoE 架构提升计算效率,实现每秒 100+ tokens 推理速度。该模型在智能体任务中表现突出。美团 CEO 王兴宣布 AI 战略全面进攻,分...
小红书自动化工具 xiaohongshu-mcp 开源发布!提升内容运营效率
开源工具 xiaohongshu-mcp 发布,基于 MCP 协议结合 AI 技术,实现小红书平台自动化登录、图文发布及数据获取。用户通过配置或命令行轻松操作,无需手动编辑。工具集成 AI 客户端,对话完成复杂...
腾讯混元开源 7B 轻量翻译模型!揽获 30 项国际赛事冠军
腾讯混元开源国际翻译模型 Hunyuan-MT-7B,支持 33 种语言及 5 种民汉方言互译。该轻量模型在 ACL WMT2025 赛事横扫 30 项语种冠军,击败参数更大对手。Flores200 测试中表现卓越,提出覆盖预训...
阶跃星辰开源 Step-Audio2mini 语音模型!集成理解生成与工具调用
阶跃星辰推出开源语音大模型 Step-Audio2mini。该模型在 MMAU 等国际基准测试中取得领先成绩,统一整合语音理解、音频生成与工具调用功能。支持语音原生 Tool Calling,实现联网搜索操作。采用...
AI 生成内容标识新规生效,微博升级标识系统
《人工智能生成合成内容标识办法》9 月 1 日生效。微博升级产品功能,添加隐式和显式标识系统,识别 AI 生成内容。用户需对合成内容声明“由 AI 生成”,否则他人可投诉“未添加 AI 标识”。该...

