Meta 发布 SAM 模型,快速分离图像中的物体

2,269次阅读
没有评论

近日 Meta 发布了一个名为 Segment Anything Model(SAM)的 AI 模型,可以识别图像和视频中的单个物体,甚至是训练中没有遇到的物体。除此之外,Meta 还发布了 Segment Anything 1-Billion mask 数据集(SA-1B),这更是有史以来发布的最大分割数据集。

Meta 发布 SAM 模型,快速分离图像中的物体

SAM 是一个图像分割模型,可以对文本提示或用户点击做出反应,在图像中分离出特定的物体。目前为特定用例创建准确的分割模型是大多数 AI 无法完成的任务,因为它需要技术专家进行高度专业化的工作,并需要获得极其强大的 AI 训练基础设施和大量有注释和特定领域的数据集。

Meta 则表示,上述这些难题都是 SAM 和 SA-1B 能够克服的问题,通过减少对特定任务的建模专业知识、训练计算和定制数据注释的需求来帮助研究人员。

Meta 发布 SAM 模型,快速分离图像中的物体

SAM 模型可以为图像或视频中的任何物体生成 “遮罩”,甚至是它以前没有遇到过的物体和图像。遮罩是一种技术,包括根据物体边缘的对比度变化来识别物体,并将其与场景的其他部分分开。Meta公司的研究人员说,SAM 的通用性足以覆盖广泛的用例,并且不需要再进行额外的训练。

SAM 结合了交互式分割和自动分割两种常见的分割方法,前者是人类通过迭代完善一个遮罩来指导模型,后者是模型在经过数百或数千个注释对象的训练后自行完成。

用于训练 SAM 的 SA-1B 图像数据集目前包含超过 11 亿个分割遮罩,这些遮罩是从 1100 万张已经获得许可,并且保护隐私的图像中收集的,它的遮罩数量也是任何现有数据集的 400 倍。

Meta 的人工智能研究人员表示:

SAM 可以成为 AR/VR、内容创作、科学领域和更普遍的 AI 系统等领域的一个强大组件。当我们展望未来时,我们看到在像素层面理解图像和更高层次的视觉内容语义理解之间的紧密耦合,释放出更强大的 AI 系统。

相比于其他模型,SAM 所面临的挑战是训练这样的一个模型,它所需的数据在网上或其他任何地方都无法获得,而文本、图像和视频则不同,这些数据在网上都十分丰富。

目前 SAM 的相关代码都以 Apache 2.0 许可上传至 GitHub,Meta 还创建了交互式的 Demo,感兴趣的用户可以尝试一下。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 4 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026 一水 2025-1...
10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了 一水 2025-12-12 13:56:19 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026 一水 2025-1...
10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了 一水 2025-12-12 13:56:19 ...
IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别

IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别

IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别 量子位的朋友们 2025-1...