新晨报-创客网络-第16页

xAI 全球招募中文 AI 训练师！Grok 增加中文语音与方言训练数据

昨日，xAI 全球招募中文 AI 训练师，支持远程，美国候选人时薪为 35 至 45 美元。招聘聚焦 Grok 语音训练，任务包括录音、转写、语音标注及口音评估，要求中文母语与 B2 英语能力。岗位处理声音...

Adminser11天前

03714

xAI 发布 Grok Imagine Video 1.5 预览版，把静态图片转成短视频，并支持最高 720p 输出。它的核心用法是上传一张图，再补充文本提示，让画面产生动态效果。产品已通过 API 开放预览，开发者可...

Adminser4天前

0245

最近，百度开端推「百度职业智能体」了，咱们从网传的一份内部资料中，提炼出了30个问题，帮助我们全面了解百度这次职业智能体是什么？要怎么做？具体作用怎么，欢迎老铁们一同留言评论。百度...

Adminser9个月前

0209

谷歌正在为 Gemini 准备名为 Spark 的智能体能力，早期截图显示，它可从 Android 版 Gemini 菜单启用，并在 Gmail、文档等 Workspace 应用中清理邮件、整理会议笔记、生成摘要。谷歌把它放进聊...

Adminser11天前

0306

PrismML 近日推出 Bonsai Image 4B 系列，把 FLUX.2 Klein 4B 的扩散 Transformer 权重改成 1-bit 与三值版本，在 iPhone 17 Pro Max 生成 512×512 图像约 9.4 秒。压缩后模型低至 0.93GB，活...

Adminser11天前

03215

字节跳动发布扣子 Coze 3.0，围绕多人、多 Agent 与跨端推进任务的需求，把 Agent 写作改为可组合的一人或多人协同模式，并加入多项目独立管理、资产自动沉淀与行业模板。新版本可接入 Claude C...

Adminser11天前

0277

OpenAI 与 Google 合作，把 SynthID 隐形水印引入 AI 图像生成，并保留 C2PA 等元数据作为双重校验。决策核心是应对虚假图片扩散，单靠文件信息容易被裁剪、转存或平台处理抹掉。新机制让图片脱...

Adminser11天前

02714

昨日，京东开源 JoyAI-Echo 长音视频生成框架，瞄准长视频中角色变脸、音色漂移和整段重算三类问题。框架用记忆库持续保存外观与声音信息，并由 Director Agent 将自然语言要求拆成剧本、场景和...

Adminser4天前

04914

苹果在 WWDC26 期间公布 iOS 27 版 Siri AI 语音改版，把声音个性化和端侧模型能力放进系统层。新界面可调节表现力与节奏，语音输入引擎会实时处理大小写、标点和格式。Siri AI 还能读取屏幕内...

Adminser4天前

0307

我今天刚刚读到了一个十分棒的关于GEO的论文。这篇论文是多位美国普林斯顿大学的教授，以及印度理工学院的教授联合编撰的。论文来自arXiv，全文的中文版我放在我的常识星球了，文末有我常识星...

Adminser9个月前

0326