排序
英伟达 PiD 把解码和放大合成一步!高分辨率出图少等一轮处理
英伟达团队发布 PiD,把潜变量解码和上采样合并为像素扩散模块,解决传统解码器只擅长复原、难补高分辨率细节的问题。它在单张 RTX 5090 上以 13 GB 峰值显存,将 512×512 潜变量直接输出到 20...
LibTV 发布团队版!实现 AI 视频同画布协作固化素材共享资产
LibTV 正式推出团队版,对标 Figma 构建 AI 视频专属协作工具,平台已积累十万级使用人群。该版本针对 AI 视频制作版本杂乱、视觉风格割裂、积分消耗无管控的行业痛点迭代升级,支持分镜组收纳...
一文讲透KOC打法的核心与思考!
当下内容平台重构了消费决议计划链,新的竞争维度是“产品+内容+算法“。“产品为王”当然正确,可是仅靠产品很难打破“流量捆绑”,或者说仅靠产品为王的破局是托言说辞逃离内卷战场的低效选择...
腾讯会议 AI 同传上线!跨语种会议可保留原声实时核验
腾讯会议近日宣布 AI 同传正式上线,由平台把实时翻译放进会中应用,不需插件或外接设备。每位参会者可单独选择收听语言,开启音色模仿后,对方听到的是接近本人声线的译音,时延低于 3 秒。它...
Ideogram 4.0 开源生图模型!海报封面电商主图文字排版可控
Ideogram 近日发布 Ideogram 4.0 开放权重文生图模型,核心规模 9.3B 参数,采用单流架构,把文本与图像 token 放进同一自注意力序列,设计控制被放到训练和推理格式中心。它加入对象和文字边界...
高德千问开源 AGenUI!一套代码跑通三端手机原生交互界面
高德与阿里千问 C 端应用团队联合发布开源框架 AGenUI,补上 A2UI 协议在手机端渲染的关键一环。过去 Agent 能生成界面描述,却难直接落到各平台原生组件,开发者往往要为 iOS、Android、Harmon...
MiniMax 发布 M3 开源!以完整权重和编程成绩提供模型切换依据
MiniMax 昨日发布 M3,并宣布将在 10 天内开源完整权重与技术报告。其决策重点不是只推出商用接口,而是让开发者可在自有基础设施部署模型,降低被单一平台绑定的风险。M3 采用 MSA 稀疏注意力...
Apple Developer 更新图标!设计规范提前转向半透明玻璃质感
Apple 近日更新 Apple Developer 应用,在 WWDC 26 前换上 Liquid Glass 视觉,并重新设计图标。新版用铅笔、画笔和尺子组成字母 A,回到开发工具的识别逻辑,也把半透明导航栏、滑块和独立搜索...
Grok V9 训练完成!Cursor 代码数据把模型重心压向工程代码处理
马斯克近日宣布,xAI 旗舰模型 Grok V9-Medium 已完成训练,进入监督微调,预计 2 至 3 周公开。它从 v8-small 的 0.5T 参数增至 1.5T,并引入大量 Cursor 代码数据,补足旧版训练数据短板。复...
Claude Code 新增 Agent View!一个界面管理所有并行任务
Google 在 I/O 前的 Android Show 上宣布,Android 17 将把 Gemini Intelligence 放到平台核心,系统不再只负责运行应用,而是直接理解输入、相机、车机和硬件任务。Gboard 可从证照、聊天和邮...












