排序
CoMPaSS-FLUX.1 模型震撼登场!大幅改进 Flux 图像生成的空间关系理解
研究团队推出 CoMPaSS-FLUX.1 模型,基于 FLUX.1 的 LoRA 适配器。该模型优化文本到图像空间关系理解,提升生成图像的物体排列准确性。VISOR 基准测试相对提升 98%,T2I - CompBench 空间测试提...
腾讯混元 Voyager 模型首发!业界首创原生 3D 重建能力
腾讯正式推出混元 Voyager 模型,成为业界首个原生支持 3D 重建的超长漫游世界模型。该模型强化空间智能应用,为虚拟现实、游戏开发等领域提供高保真 3D 场景漫游功能。突破传统限制,生成一致...
谷歌 Gemini 3 Pro 预览版亮相!百万 Token 上下文直指 GPT-4o
谷歌最新 AI 模型 Gemini 3 Pro 预览版已现身 Vertex AI 平台。该模型支持高达 100 万 Token 的超大上下文窗口,显著提升了多模态推理与代理式智能能力。其性能有望全面超越 GPT-4o,正式版本预...
打造专属话题空间!OpenAI 向免费用户开放 ChatGPT Projects 服务
OpenAI 昨日宣布向免费用户开放 ChatGPT Projects 服务。该服务帮助用户整理对话到主题文件夹,告别杂乱记录。用户可添加文件、增加自定义指令,限制对话记忆在文件夹内。免费用户上传 5 个文件...
百度推出新一代文字识别 PP-OCRv5 OCR 模型!优化文本识别性能
百度近日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。该模型高效轻量,参数量仅 0.07B,在 CPU 上每秒处理超过 370 个字符。PP-OCRv5 在 OCR 基准测试中超越 Gemini 2.5 Pro、Qwen2....
Atlassian 收购 The Browser Company!推动 Dia 浏览器 AI 化
近日 Atlassian 宣布以 6.1 亿美元现金收购 The Browser Company,后者开发了 Arc 和 Dia 浏览器。交易估值超过该公司去年融资后水平约 6000 万美元,预计 12 月前完成。收购后,The Browser Co...
Replit 推出 AI Integrations!免 API 密钥直连 300+ 模型
Replit 发布 AI Integrations,用户在平台内直连 300+ 模型,无需开发者账号与 API 密钥。智能助手按需求选型并请求授权,后台自动配置凭证与计费,仪表板透明展示用量与费用,聊天机器人与图像...
通义实验室发布 AgentScope 1.0!简化智能体开发
通义实验室推出新一代智能体开发框架 AgentScope 1.0,助力开发更简单安全。该开源框架采用三层架构:核心框架实现模块化扩展,Runtime 提供安全沙箱和部署引擎,Studio 支持监控评测。框架强化...
MetaGPT 推出高精度跨平台测试工具 RealDevWorld!精准度达 92%
MetaGPT 团队昨日发布端到端自动化测试工具 RealDevWorld。该工具基于多智能体框架开发,实现代码生成到测试全流程自主化。支持桌面、移动和 Web 三大平台,提供 7×24 小时不间断测试。其动态...
Hume AI 革新语音转换!单次录音即可精准复刻情感至任意声线
Hume AI 的新功能分析原始录音的节奏与情感,并将其精准移植到超 200 万种声音上。该技术保留了原声的情感起伏,支持 11 种语言的自然转换。创作者与开发者可通过 Creator Studio 或 API 接口,...

