排序
微软 Copilot 实验室推出文本转语音工具!支持情感风格定制
微软推出实验性平台 Copilot Labs,首发工具“音频表达”支持文本转语音功能。该工具基于最新语音模型,用户可自由调整音频情感、语调及风格,适配故事讲述与演讲等场景。提供情感模式和故事模...
CoMPaSS-FLUX.1 模型震撼登场!大幅改进 Flux 图像生成的空间关系理解
研究团队推出 CoMPaSS-FLUX.1 模型,基于 FLUX.1 的 LoRA 适配器。该模型优化文本到图像空间关系理解,提升生成图像的物体排列准确性。VISOR 基准测试相对提升 98%,T2I - CompBench 空间测试提...
美团开源 560B 参数 AI 大模型 LongCat-Flash!年投超百亿布局生态
美团发布并开源 5600 亿参数混合专家模型 LongCat-Flash,采用 MoE 架构提升计算效率,实现每秒 100+ tokens 推理速度。该模型在智能体任务中表现突出。美团 CEO 王兴宣布 AI 战略全面进攻,分...
小红书自动化工具 xiaohongshu-mcp 开源发布!提升内容运营效率
开源工具 xiaohongshu-mcp 发布,基于 MCP 协议结合 AI 技术,实现小红书平台自动化登录、图文发布及数据获取。用户通过配置或命令行轻松操作,无需手动编辑。工具集成 AI 客户端,对话完成复杂...
腾讯混元开源 7B 轻量翻译模型!揽获 30 项国际赛事冠军
腾讯混元开源国际翻译模型 Hunyuan-MT-7B,支持 33 种语言及 5 种民汉方言互译。该轻量模型在 ACL WMT2025 赛事横扫 30 项语种冠军,击败参数更大对手。Flores200 测试中表现卓越,提出覆盖预训...
阶跃星辰开源 Step-Audio2mini 语音模型!集成理解生成与工具调用
阶跃星辰推出开源语音大模型 Step-Audio2mini。该模型在 MMAU 等国际基准测试中取得领先成绩,统一整合语音理解、音频生成与工具调用功能。支持语音原生 Tool Calling,实现联网搜索操作。采用...
AI 生成内容标识新规生效,微博升级标识系统
《人工智能生成合成内容标识办法》9 月 1 日生效。微博升级产品功能,添加隐式和显式标识系统,识别 AI 生成内容。用户需对合成内容声明“由 AI 生成”,否则他人可投诉“未添加 AI 标识”。该...
上海 AI 实验室发布 InternVL3.5 多模态大模型!性能超越 GPT-5
上海 AI 实验室推出多模态大模型 InternVL3.5。该模型采用级联强化学习、动态视觉分辨率路由及解耦部署架构,全面升级推理能力与通用性。在多项基准测试中表现超越 GPT-5 和 Claude-3.7-Sonnet ...
上周热门文章:《深度测评!谷歌全新 AI 模型 Nano Banana(附 30+ 提示词案例)》
大家好,我是言川。最近,一款名为 Nano banana 的神秘图像编辑模型火爆全网,昨晚熬了通宵测试了 100+案例,得出一个结论:它就是目前最强的图像编辑模型,完美解决了 Flux Kontext、GPT-4o 对...
AI 生成内容强制标识!《人工智能生成合成内容标识办法》正式实施
国家网信办等四部门联合发布的《人工智能生成合成内容标识办法》今日起施行。新规强制服务提供者为 AI 生成的文本、图片、音频等内容添加显式标识或隐式标识。用户可感知显式标识,隐式标识嵌入...

