排序
xAI 全球招募中文 AI 训练师!Grok 增加中文语音与方言训练数据
昨日,xAI 全球招募中文 AI 训练师,支持远程,美国候选人时薪为 35 至 45 美元。招聘聚焦 Grok 语音训练,任务包括录音、转写、语音标注及口音评估,要求中文母语与 B2 英语能力。岗位处理声音...
xAI 发布 Grok Imagine Video 1.5!图片转短片开放 API 接入
xAI 发布 Grok Imagine Video 1.5 预览版,把静态图片转成短视频,并支持最高 720p 输出。它的核心用法是上传一张图,再补充文本提示,让画面产生动态效果。产品已通过 API 开放预览,开发者可...
百度又能够了?7×24小时主动接单神器:百度智能体,老板们躺着也能赚线索
最近,百度开端推「百度职业智能体」了,咱们从网传的一份内部资料中,提炼出了30个问题,帮助我们全面了解百度这次职业智能体是什么?要怎么做?具体作用怎么,欢迎老铁们一同留言评论。 百度...
谷歌 Gemini Spark 曝光!系统级 AI 入口开始接管邮件与文档处理
谷歌正在为 Gemini 准备名为 Spark 的智能体能力,早期截图显示,它可从 Android 版 Gemini 菜单启用,并在 Gmail、文档等 Workspace 应用中清理邮件、整理会议笔记、生成摘要。谷歌把它放进聊...
PrismML 发布 Bonsai Image 4B!跑通手机本地生图压低内存门槛
PrismML 近日推出 Bonsai Image 4B 系列,把 FLUX.2 Klein 4B 的扩散 Transformer 权重改成 1-bit 与三值版本,在 iPhone 17 Pro Max 生成 512×512 图像约 9.4 秒。压缩后模型低至 0.93GB,活...
字节上线扣子 Coze 3.0!将本地 Agent 与跨端项目收进同一平台
字节跳动发布扣子 Coze 3.0,围绕多人、多 Agent 与跨端推进任务的需求,把 Agent 写作改为可组合的一人或多人协同模式,并加入多项目独立管理、资产自动沉淀与行业模板。新版本可接入 Claude C...
OpenAI 接入 SynthID 水印,AI 图片来源验证减少误用风险
OpenAI 与 Google 合作,把 SynthID 隐形水印引入 AI 图像生成,并保留 C2PA 等元数据作为双重校验。决策核心是应对虚假图片扩散,单靠文件信息容易被裁剪、转存或平台处理抹掉。新机制让图片脱...
京东开源 JoyAI-Echo 长视频框架!对话改镜头并保留声画一致
昨日,京东开源 JoyAI-Echo 长音视频生成框架,瞄准长视频中角色变脸、音色漂移和整段重算三类问题。框架用记忆库持续保存外观与声音信息,并由 Director Agent 将自然语言要求拆成剧本、场景和...
苹果 iOS 27 重做 Siri AI 语音!系统级输入和屏幕理解前移到设备端
苹果在 WWDC26 期间公布 iOS 27 版 Siri AI 语音改版,把声音个性化和端侧模型能力放进系统层。新界面可调节表现力与节奏,语音输入引擎会实时处理大小写、标点和格式。Siri AI 还能读取屏幕内...
从SEO到GEO:迎接AI查找新时代的生存规律——深度解读《GEO: 生成引擎优化》
我今天刚刚读到了一个十分棒的关于GEO的论文。 这篇论文是多位美国普林斯顿大学的教授,以及印度理工学院的教授联合编撰的。 论文来自arXiv,全文的中文版我放在我的常识星球了,文末有我常识星...












