CoMPaSS-FLUX.1 模型震撼登场!大幅改进 Flux 图像生成的空间关系理解
研究团队推出 CoMPaSS-FLUX.1 模型,基于 FLUX.1 的 LoRA 适配器。该模型优化文本到图像空间关系理解,提升生成图像的物体排列准确性。VISOR 基准测试相对提升 98%,T2I - CompBench 空间测试提...
挑战行业标杆!苹果推出 STARFlow 图像生成技术
苹果公司发布全新 AI 图像生成系统 STARFlow,融合正则化流与自回归变换器技术。该系统突破高分辨率图像生成瓶颈,优化深浅设计并操控潜在空间,显著提升图像效率与质量。苹果联合学术机构推动...
谷歌 Gemini 新增 URL Context 功能,AI 可深度解析网页及文档
谷歌 Gemini API 上线 URL Context 功能,支持开发者通过链接读取网页、PDF 等文件完整内容。该功能可解析 34MB 以内的文档表格、图片等多模态数据,替代传统 RAG 复杂流程。Thomas Reid 测试证...
通义实验室发布 AgentScope 1.0!简化智能体开发
通义实验室推出新一代智能体开发框架 AgentScope 1.0,助力开发更简单安全。该开源框架采用三层架构:核心框架实现模块化扩展,Runtime 提供安全沙箱和部署引擎,Studio 支持监控评测。框架强化...
即梦 AI 联火山引擎开放 API!企业快速接入 AI 图像视频模型
即梦 AI 与火山引擎宣布开放 API 服务,推出文生图、图生图、视频生成等多款 AI 模型。企业开发者自助下单接入,无需额外申请。这些模型支持故事短片创作、营销物料制作、游戏素材设计等场景,...
腾讯混元 Voyager 模型首发!业界首创原生 3D 重建能力
腾讯正式推出混元 Voyager 模型,成为业界首个原生支持 3D 重建的超长漫游世界模型。该模型强化空间智能应用,为虚拟现实、游戏开发等领域提供高保真 3D 场景漫游功能。突破传统限制,生成一致...
胜利日大阅兵即将开始!受阅部队已在长安街列阵,准备就绪
我国新征程首次阅兵今日举行,受阅部队集结长安街。45 个方(梯)队亮相,仪仗方队率先接受检阅。阅兵展示陆军、海军、空军、火箭军 4 支军种及军事航天、网络空间等 4 支兵种的全新布局。全军...
MetaGPT 推出高精度跨平台测试工具 RealDevWorld!精准度达 92%
MetaGPT 团队昨日发布端到端自动化测试工具 RealDevWorld。该工具基于多智能体框架开发,实现代码生成到测试全流程自主化。支持桌面、移动和 Web 三大平台,提供 7×24 小时不间断测试。其动态...
WordPress 推出 AI 网站建设工具 Telex!简化网站构建
在 WordCamp US 2025 大会上,WordPress 创始人 Matt Mullenweg 推出 AI 开发工具 Telex。用户输入简单提示,Telex 便能生成内容块并打包下载,直接安装使用。该工具降低技术门槛,使建站更直观...
ElevenLabs 推出 AI 音效模型 V2,支持 30 秒音频生成
ElevenLabs 发布 AI 音效模型 V2,新增无缝循环功能,提升保真度至 48kHz。用户通过文本提示生成音效,网页或 API 访问。音效库扩展,优化搜索,添加收藏和混音工具。SB - 1 音板兼容新模型,集...




