微软 Copilot 实验室推出文本转语音工具!支持情感风格定制
微软推出实验性平台 Copilot Labs,首发工具“音频表达”支持文本转语音功能。该工具基于最新语音模型,用户可自由调整音频情感、语调及风格,适配故事讲述与演讲等场景。提供情感模式和故事模...
字节跳动开源 USO 模型!攻克 AI 生图风格主体融合难题
字节跳动开源全新 USO 模型,解决 AI 生图领域风格参考与主体保持一致性的挑战。该模型训练使用三元组数据集,实施两阶段策略:先编码深层艺术风格特征,再结合主体内容确保核心不变。引入强化...
火山引擎推出命令行 AI 工具 veCLI!终端集成多模型提升开发效率
字节跳动火山引擎近日发布命令行 AI 工具 veCLI,无缝集成豆包大模型 1.6。该工具通过'思考-行动'循环机制支持多步推理,开发者能在终端直接调用火山方舟大模型及云服务。veCLI 同时接入 Kimi-K...
清华大学开源 GUAVA 模型!单张照片 0.1 秒生成 3D 数字人
清华大学研究团队开源高效 3D 数字人生成模型 GUAVA。该模型支持通过单张照片快速创建高质量 3D 数字人,耗时仅需 0.1 秒。这一技术突破大幅提升数字人制作效率,推动数字内容创作、虚拟形象等...
中国首个 AI 海洋大模型“瞰海”发布!可预测未来 10 天海洋环境
近日,国家卫星海洋应用中心发布我国首个端到端 AI 海洋大模型“瞰海”。该模型贯通“遥感—重构—预测”全链路,利用自主卫星观测数据,可生成未来 10 天内自海面至水下约 600 米的温度、盐度...
印象笔记 Evernote 更新 LOGO!重塑大象形象,融入 AI 智能升级
印象笔记于今年推出 v11 版本,完成五年来首次重大升级。新版本对标志性的绿色大象进行系统性简化重构,象鼻弧线更自然流畅,耳部与眼部结构消除僵硬折线感,增强数字界面可读性。字标从首字母...
小度 AI 眼镜 Pro 发布:集成 4K 拍摄 AI 同传等多种智能功能
百度推出的小度 AI 眼镜 Pro 是一款集智能功能与时尚设计于一体的设备,售价 2299 元,拥有多种款式和镜片选择。它配备索尼 1200 万像素镜头,支持 4K 拍照与视频防抖。内置多模态 AI 模型,实...
节跳动推出 InfinityStar 框架!大幅提升视频生成速度
字节推出 InfinityStar 框架,将 5 秒 720p 视频生成时长缩至 58 秒,效率与画质同步提升。框架采用时空金字塔解耦外观与运动,并以 VAE 知识继承加速训练与降本,覆盖图像生成、文生视频、视频...
Lovart AI 推出图层拆分功能!无源文件也能编辑海报
AI 设计平台 Lovart AI 推出 “Edit Elements” 新功能,用户上传成品海报即可自动拆分为独立的文字、主体和背景图层。该功能解决了无 PSD 源文件的编辑难题,支持用户自由修改文本、移动或替换...
陶哲轩实测 Gemini 3 十分钟攻克数学难题,刷新多项科研基准
谷歌上周发布 Gemini 3,迅速刷新 FrontierMath 数学基准纪录,综合得分 154 分反超 GPT-5.1。数学家陶哲轩利用 Deepthink 模式,仅耗时 10 分钟便攻克埃尔德什问题 #367 关键证明。该模型同步...



