金融时报的报道说,面对把房子吵得天翻地覆、把食物扔得满地都是的婴儿,焦头烂额的父母可能会惊讶地发现,他们心爱的孩子可能是已知宇宙中最聪明的学习者。不过,一些计算机科学家早已认识到这一现实,现在正试图模仿婴儿的超常处理能力来开发人工智能模型。
在某些方面,我们最新的人工智能技术创造在能力上近乎神奇,但在自主学习方面却像尿布一样。能否像婴儿处理单元那样,通过探索部分、杂乱无章的真实世界数据来训练它们学习呢?
纽约大学的一个研究小组一直在尝试这样做,并于本月在《科学》杂志上发表了他们的研究成果。实验从阿德莱德一个名叫萨姆的婴儿头部连接的轻型摄像头中提取数据,记录了他从6个月大到25个月大的61个小时的生活。
视频流包括杂乱无章的图像和父母、猫、游戏和玩具的声音,然后被处理成60万个视频帧和37500个转录 “语句”,并输入一个神经网络。
面临的挑战是如何将山姆在大约 1% 的清醒时间内看到的东西与他听到的声音相匹配,从而创建一个多模态人工智能模型。
婴儿是如何理解 “球 “这个词与不同类型的圆形、有弹性、五颜六色的物体有关呢?
认知科学家对这一问题的解释众说纷纭,但都认为婴儿是非常出色的学习者,他们能从有限的输入中进行归纳。六至九个月大的婴儿开始将文字与图像联系起来。
两岁前,他们平均学会了 300 个单词,其中大部分是名词。
迄今为止,试图建立能将文本、图像、音频和视频结合起来的多模态人工智能模型,大多依赖于将大量计算能力应用于海量的策划数据。但纽约大学的研究人员发现,他们的模型可以成功地将图像和声音,与一个婴儿视频画面中的少量数据联系起来。他们的模型在对22个 “视觉概念 “进行分类时,准确率达到61.6%。
纽约大学论文的第一作者Wai Keen Vong在接受采访时说:”我们非常惊讶,在数据有限的情况下,模型竟然能表现出相当出色的学习能力。”
这些发现,对未来人工智能模型的开发是一个令人鼓舞的迹象。但是,正如Vong所指出的,这些发现也凸显了婴儿本身惊人的学习能力,他们可以对视觉信号做出反应,并发展出自己的学习假设。
婴儿早熟的部分原因是,人类婴儿在不得不自食其力之前,会花很长一段时间积极探索这个世界。
“儿童是人类的研发部门,蓝天研究者、头脑风暴者。成人是生产和营销部门”,艾莉森· 戈普尼克在她的著作《哲学婴儿》(The Philosophical Baby)中这样写道。
加州大学伯克利分校的心理学教授戈普尼克认为,婴儿拥有人工智能系统所缺乏的三项核心技能。首先,婴儿擅长建立富有想象力的模型,创建概念框架来解释世界。他们还充满好奇心,喜欢冒险,是具身的学习者,会积极探索新环境,而不是被动地封装在一行行代码中。
婴儿是社会性动物,他们从所有与之互动的人身上学习,帮助培养同理心、利他主义和道德感。
戈普尼克在一封电子邮件中说,纽约大学这项 “引人入胜、非常聪明 “的研究表明,人工智能模型可以从婴儿经历的数据中提取语言信息。但是,正如论文作者所承认的,婴儿也会使用不同的数据,这些数据是他们从主动探索和社会互动中获得的。
戈普尼克写道:”模型的成功仍然非常有限,它们可能利用了婴儿的探索和社会学习能力,但这并不意味着它们本身就具备这些能力。”
戈普尼克写道:”要想通过计算复制婴儿的自然学习能力,还需要更多的研究。尤其是,我们如何才能制造出具有常识和社会推理能力的机器?人工智能模型或许可以学习与实物相关的名词,但它们在学习抽象概念和动词方面仍有困难。尽管人工智能取得了令人惊叹的进步,但我们仍需要从婴儿大脑这个小小的生物湿件袋中学到很多东西。”