新晨报-创客网络-第6页

英伟达 PiD 把解码和放大合成一步！高分辨率出图少等一轮处理

英伟达团队发布 PiD，把潜变量解码和上采样合并为像素扩散模块，解决传统解码器只擅长复原、难补高分辨率细节的问题。它在单张 RTX 5090 上以 13 GB 峰值显存，将 512×512 潜变量直接输出到 20...

Adminser16天前

04515

LibTV 正式推出团队版，对标 Figma 构建 AI 视频专属协作工具，平台已积累十万级使用人群。该版本针对 AI 视频制作版本杂乱、视觉风格割裂、积分消耗无管控的行业痛点迭代升级，支持分镜组收纳...

Adminser16天前

0445

当下内容平台重构了消费决议计划链，新的竞争维度是“产品+内容+算法“。“产品为王”当然正确，可是仅靠产品很难打破“流量捆绑”，或者说仅靠产品为王的破局是托言说辞逃离内卷战场的低效选择...

Adminser9个月前

0448

腾讯会议近日宣布 AI 同传正式上线，由平台把实时翻译放进会中应用，不需插件或外接设备。每位参会者可单独选择收听语言，开启音色模仿后，对方听到的是接近本人声线的译音，时延低于 3 秒。它...

Adminser16天前

04410

Ideogram 近日发布 Ideogram 4.0 开放权重文生图模型，核心规模 9.3B 参数，采用单流架构，把文本与图像 token 放进同一自注意力序列，设计控制被放到训练和推理格式中心。它加入对象和文字边界...

Adminser9天前

04410

高德与阿里千问 C 端应用团队联合发布开源框架 AGenUI，补上 A2UI 协议在手机端渲染的关键一环。过去 Agent 能生成界面描述，却难直接落到各平台原生组件，开发者往往要为 iOS、Android、Harmon...

Adminser16天前

0445

MiniMax 昨日发布 M3，并宣布将在 10 天内开源完整权重与技术报告。其决策重点不是只推出商用接口，而是让开发者可在自有基础设施部署模型，降低被单一平台绑定的风险。M3 采用 MSA 稀疏注意力...

Adminser16天前

0447

Apple 近日更新 Apple Developer 应用，在 WWDC 26 前换上 Liquid Glass 视觉，并重新设计图标。新版用铅笔、画笔和尺子组成字母 A，回到开发工具的识别逻辑，也把半透明导航栏、滑块和独立搜索...

Adminser16天前

0437

马斯克近日宣布，xAI 旗舰模型 Grok V9-Medium 已完成训练，进入监督微调，预计 2 至 3 周公开。它从 v8-small 的 0.5T 参数增至 1.5T，并引入大量 Cursor 代码数据，补足旧版训练数据短板。复...

Adminser16天前

04311

Google 在 I/O 前的 Android Show 上宣布，Android 17 将把 Gemini Intelligence 放到平台核心，系统不再只负责运行应用，而是直接理解输入、相机、车机和硬件任务。Gboard 可从证照、聊天和邮...

Adminser16天前

0439