苹果在 Hugging Face 平台开源 FastVLM 和 MobileCLIP2 视觉语言模型。FastVLM 优化高分辨率图像处理,提升速度 85 倍。MobileCLIP2 实现高效图像文本对齐,适配边缘设备。两款模型支持实时视频描述和自动 Agent 功能。苹果提供开源代码和技术论文,助力开发者创新。[[来源:https://huggingface.co/collections/apple/fastvlm-68ac97b9cd5cacefdd04872e]]
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容