logo
繁体
繁体

Meta 发布可以识别图像和视频中物体的 AI 模型SAM

据路透,Facebook的所有者Meta公司周三发布了一个人工智能模型,可以从图像中挑选出单个物体,同时还发布了一个图像注释数据集,据称是同类产品中最大的。

Photo by Dima Solomin on Unsplash 

Meta公司研究部门在一篇博文中说,其Segment Anything Model(即SAM)可以识别图像和视频中的物体,即使在训练中没有遇到这些物品。

使用SAM,可以通过点击对象或书写文字提示来选择对象。在一次演示中,写下 “猫 “这个词后,这个工具在一张照片中的几只猫的周围画出方框。

Meta公司已经预告了几项功能,部署了让ChatGPT流行起来的生成性人工智能类型,创造全新的内容,而不是像其他人工智能那样简单地识别或分类数据,尽管还没有发布产品。

这方面的例子,包括一个从文本提示中生成超现实主义视频的工具,以及另一个从散文中生成儿童书籍插图的工具。

扎克伯格表示,将这种生成性人工智能 “创意辅助工具 “,纳入Meta的应用程序是今年的优先事项。

Meta公司内部确实已经使用了与SAM类似的技术,用于标记照片、审核违禁内容以及确定向Facebook和Instagram用户推荐哪些帖子等活动。

公司表示,SAM的发布将扩大对该类型技术的使用。

SAM模型和数据集将在非商业许可下提供下载。用户将自己的图像上传到附带的原型上,也必须同意只用于研究目的。