胜利日大阅兵即将开始!受阅部队已在长安街列阵,准备就绪
我国新征程首次阅兵今日举行,受阅部队集结长安街。45 个方(梯)队亮相,仪仗方队率先接受检阅。阅兵展示陆军、海军、空军、火箭军 4 支军种及军事航天、网络空间等 4 支兵种的全新布局。全军...
腾讯混元 Voyager 模型首发!业界首创原生 3D 重建能力
腾讯正式推出混元 Voyager 模型,成为业界首个原生支持 3D 重建的超长漫游世界模型。该模型强化空间智能应用,为虚拟现实、游戏开发等领域提供高保真 3D 场景漫游功能。突破传统限制,生成一致...
即梦 AI 联火山引擎开放 API!企业快速接入 AI 图像视频模型
即梦 AI 与火山引擎宣布开放 API 服务,推出文生图、图生图、视频生成等多款 AI 模型。企业开发者自助下单接入,无需额外申请。这些模型支持故事短片创作、营销物料制作、游戏素材设计等场景,...
通义实验室发布 AgentScope 1.0!简化智能体开发
通义实验室推出新一代智能体开发框架 AgentScope 1.0,助力开发更简单安全。该开源框架采用三层架构:核心框架实现模块化扩展,Runtime 提供安全沙箱和部署引擎,Studio 支持监控评测。框架强化...
谷歌 Gemini 新增 URL Context 功能,AI 可深度解析网页及文档
谷歌 Gemini API 上线 URL Context 功能,支持开发者通过链接读取网页、PDF 等文件完整内容。该功能可解析 34MB 以内的文档表格、图片等多模态数据,替代传统 RAG 复杂流程。Thomas Reid 测试证...
挑战行业标杆!苹果推出 STARFlow 图像生成技术
苹果公司发布全新 AI 图像生成系统 STARFlow,融合正则化流与自回归变换器技术。该系统突破高分辨率图像生成瓶颈,优化深浅设计并操控潜在空间,显著提升图像效率与质量。苹果联合学术机构推动...
微软 Copilot 实验室推出文本转语音工具!支持情感风格定制
微软推出实验性平台 Copilot Labs,首发工具“音频表达”支持文本转语音功能。该工具基于最新语音模型,用户可自由调整音频情感、语调及风格,适配故事讲述与演讲等场景。提供情感模式和故事模...
CoMPaSS-FLUX.1 模型震撼登场!大幅改进 Flux 图像生成的空间关系理解
研究团队推出 CoMPaSS-FLUX.1 模型,基于 FLUX.1 的 LoRA 适配器。该模型优化文本到图像空间关系理解,提升生成图像的物体排列准确性。VISOR 基准测试相对提升 98%,T2I - CompBench 空间测试提...
美团开源 560B 参数 AI 大模型 LongCat-Flash!年投超百亿布局生态
美团发布并开源 5600 亿参数混合专家模型 LongCat-Flash,采用 MoE 架构提升计算效率,实现每秒 100+ tokens 推理速度。该模型在智能体任务中表现突出。美团 CEO 王兴宣布 AI 战略全面进攻,分...
小红书自动化工具 xiaohongshu-mcp 开源发布!提升内容运营效率
开源工具 xiaohongshu-mcp 发布,基于 MCP 协议结合 AI 技术,实现小红书平台自动化登录、图文发布及数据获取。用户通过配置或命令行轻松操作,无需手动编辑。工具集成 AI 客户端,对话完成复杂...