排序
开源 TTS 模型 Maya1 发布!30 亿参数驱动实时情感语音
新一代开源文本转语音模型 Maya1 正式亮相。该模型拥有 30 亿参数,通过融合自然语言描述与多样化情感标签,能够实时生成丰富且细腻的语音。其高效设计使其可在单张 GPU 上流畅运行,大幅降低了...
小红书自动化工具 xiaohongshu-mcp 开源发布!提升内容运营效率
开源工具 xiaohongshu-mcp 发布,基于 MCP 协议结合 AI 技术,实现小红书平台自动化登录、图文发布及数据获取。用户通过配置或命令行轻松操作,无需手动编辑。工具集成 AI 客户端,对话完成复杂...
微软 Copilot 实验室推出文本转语音工具!支持情感风格定制
微软推出实验性平台 Copilot Labs,首发工具“音频表达”支持文本转语音功能。该工具基于最新语音模型,用户可自由调整音频情感、语调及风格,适配故事讲述与演讲等场景。提供情感模式和故事模...
Raycast 集成 Cursor Agent 插件!大幅提升 AI 编程开发效率
Raycast 推出 Cursor Agent 插件,将 Cursor AI 功能整合进快捷启动器。开发者可直接启动 Cursor AI 代理编辑运行代码,实时查看运行状态,发送后续指令或手动接管任务。该插件减少工具切换,支...
字节跳动开源 USO 模型!攻克 AI 生图风格主体融合难题
字节跳动开源全新 USO 模型,解决 AI 生图领域风格参考与主体保持一致性的挑战。该模型训练使用三元组数据集,实施两阶段策略:先编码深层艺术风格特征,再结合主体内容确保核心不变。引入强化...
火山引擎推出命令行 AI 工具 veCLI!终端集成多模型提升开发效率
字节跳动火山引擎近日发布命令行 AI 工具 veCLI,无缝集成豆包大模型 1.6。该工具通过'思考-行动'循环机制支持多步推理,开发者能在终端直接调用火山方舟大模型及云服务。veCLI 同时接入 Kimi-K...
清华大学开源 GUAVA 模型!单张照片 0.1 秒生成 3D 数字人
清华大学研究团队开源高效 3D 数字人生成模型 GUAVA。该模型支持通过单张照片快速创建高质量 3D 数字人,耗时仅需 0.1 秒。这一技术突破大幅提升数字人制作效率,推动数字内容创作、虚拟形象等...
中国首个 AI 海洋大模型“瞰海”发布!可预测未来 10 天海洋环境
近日,国家卫星海洋应用中心发布我国首个端到端 AI 海洋大模型“瞰海”。该模型贯通“遥感—重构—预测”全链路,利用自主卫星观测数据,可生成未来 10 天内自海面至水下约 600 米的温度、盐度...
印象笔记 Evernote 更新 LOGO!重塑大象形象,融入 AI 智能升级
印象笔记于今年推出 v11 版本,完成五年来首次重大升级。新版本对标志性的绿色大象进行系统性简化重构,象鼻弧线更自然流畅,耳部与眼部结构消除僵硬折线感,增强数字界面可读性。字标从首字母...
小度 AI 眼镜 Pro 发布:集成 4K 拍摄 AI 同传等多种智能功能
百度推出的小度 AI 眼镜 Pro 是一款集智能功能与时尚设计于一体的设备,售价 2299 元,拥有多种款式和镜片选择。它配备索尼 1200 万像素镜头,支持 4K 拍照与视频防抖。内置多模态 AI 模型,实...

