新晨报-创客网络-第5页

OpenCV 5 发布！Transformer 视觉模型进库，三维原型可复用

OpenCV 团队本周发布 OpenCV 5，对这个二十多年历史的计算机视觉库做架构现代化。新版本重写 DNN 引擎，扩大 ONNX 算子覆盖，并原生支持 Transformer、视觉语言模型和大型语言模型，是因为传统...

Adminser9天前

0466

腾讯混元正式推出 Hy-Memory，作为 Openclaw 等长期协作型 Agent 的记忆插件。腾讯认为，普通对话记忆难以保留跨天决策、被否方案和偏好变化，长期任务容易退回一次性问答。Hy-Memory 用 6 层记...

Adminser16天前

04513

Krea 近期围绕 Seedance 2.0 开放视频生成入口，并将其定位为新一代 AI 视频模型。相比只在模型榜单里看参数，这类平台接入让使用者能直接用文本生成视频，测试镜头运动、角色稳定性和画面连续...

Adminser16天前

0458

谷歌更新垃圾内容政策，把操纵 AI 模型回答的“AI 投毒”列为违规，范围覆盖搜索结果、AI 概览和 AI 模式。原因是部分 GEO 服务通过误导性榜单和植入提示词，试图让模型长期把特定网站记成权威...

Adminser16天前

0456

追觅科技创始人俞浩单日最高更新 75 条社交动态，刷屏各大平台引来同行吐槽。他借助 AI 生成女装变装内容趣味回应争议，面对负面自媒体评价也选择直接硬刚。俞浩还设置现金奖励，动员全体员工入...

Adminser16天前

04514

OpenAI 近日宣布，ChatGPT 可在用户上传表单后识别字段，并按语音或文字指令补全姓名、地址、目标等信息。演示中，它把图像理解、语音交互和内容生成连在一次对话里，减少逐项录入。限制也明确...

Adminser16天前

04514

英伟达团队发布 PiD，把潜变量解码和上采样合并为像素扩散模块，解决传统解码器只擅长复原、难补高分辨率细节的问题。它在单张 RTX 5090 上以 13 GB 峰值显存，将 512×512 潜变量直接输出到 20...

Adminser16天前

04515

微软研究院 AI Frontiers 发布 Fara1.5 系列，面向浏览器计算机使用智能体。它基于 Qwen3.5 微调，可在 MagenticLite 沙盒中读取截图，输出鼠标和键盘动作；27B 版本在 Online-Mind2Web 成功率...

Adminser16天前

0457

据财新报道，腾讯音乐娱乐集团已完成收购喜马拉雅，并将在监管要求下解除音频内容独家授权。腾讯音乐可继续整合有声书、知识付费、播客等长音频内容，与音乐流媒体、K 歌和社交娱乐服务形成覆盖...

Adminser16天前

04510

英伟达联合香港理工大学、南京大学等机构推出 LocateAnything，用于在照片和截图中按指令框出目标。团队认为，机器人与 AI Agent 只看懂画面并不足以完成即时操作，还要快速确认落点，因此将边...

Adminser16天前

0458