小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio
小米昨日正式开源了首个原生端到端语音大模型 Xiaomi‑MiMo‑Audio,该模型是目前业界少有的端到端语音大模型,凭借大规模训练数据、创新预训练架构以及首次实现的 ICL 少样本泛化,已经在多个...
Higgsfield 新工具 Photodump Studio!免费打造会说话的时尚大片
Higgsfield 发布 Photodump Studio 工具,用户可免费训练 Soul ID 角色,一键生成 26 张时尚大片,并通过 Unlimited Lipsync Studio 让照片'开口说话'。新用户可领取 Lipsync Studio 试用套餐,...
腾讯混元 3D Studio 上线!创作效率跃升分钟级
腾讯推出混元 3D Studio,专为 3D 设计师、游戏开发者和建模师打造 AI 工作台,整合概念设计、几何建模、贴图、蒙皮和动画制作全链路流程,将 3D 资产生产周期从“天”缩短至“分钟”级。平台引...