据 美国全国广播公司财经频道3月4日报道,Instagram上充满了普格犬、法拉利、山、早午餐、海滩和婴儿的图片分享,而该公司的所有者Facebook正在利用这个宝库来教机器了解照片中的内容。
Facebook在周四(3月4日)宣布,它已经建立了一个人工智能程序,可以“看到”它正在看的东西。它通过向它输入超过10亿张来自Instagram的公开图片来实现的。
Facebook称,被称为SEER的“计算机视觉”程序在对象识别测试中的表现优于现有的AI模型。
它在尝试ImageNet提供的测试时,取得了84.2%的“分类准确率得分”,ImageNet是一个大型视觉数据库,旨在用于视觉对象识别软件研究。基本上,它测试的是一个AI程序是否能识别照片中的内容。
许多AI模型都是在仔细标记的数据集上进行训练的,而Facebook表示,SEER通过分析随机的的Instagram图片,学会了如何识别照片中的物体。这种AI技术被称为自我监督学习。
Facebook的研究人员在一篇博客文章中写道:“人工智能的未来在于创建系统,这些系统可以直接从任何给定的信息中学习,无论是文本、图像还是其他类型的数据。而不需要依靠精心策划和标记的数据集来教它们如何识别照片中的对象,解释一个文本块,或者执行我们要求它执行的其他无数任务。”
他们补充道:“SEER的表现表明,自我监督学习可以在现实世界的环境中出色地完成计算机视觉任务,这是一个突破,最终为未来更加灵活、准确和适应性更强的计算机视觉模型扫清了道路。”
虽然这只是一个研究项目,但Facebook发言人表示,潜在用途比较广泛。该公司表示,这些用途包括改进自动生成的文本,用于向有视觉障碍的人描述图片,更好地对Facebook Marketplace上销售的商品进行自动分类,以及更好的系统,让有害图片远离Facebook平台。
但许多Instagram用户可能会惊讶地听到,他们的图片被用来训练Facebook的AI系统。
Facebook人工智能研究的软件工程师普里亚·戈亚尔(Priya Goyal)告诉CNBC:“我们在数据政策中告知Instagram账户持有人,我们使用我们所拥有的信息来支持研究和创新,包括在这样的技术进步中。”
Facebook表示,它将开源部分软件,以便其他研究人员可以对其进行实验。
包括谷歌和微软在内的其他大型科技公司也在尝试推动计算机视觉的发展。去年夏天,谷歌发布了SimCLRv2计算机视觉模型,而OpenAI发布了iGPT 2。