Kate Kaye在Protocol发表文章,为了提高人工智能的准确度和公正性,必须用大量的数据训练人工智能,但是在现实生活中,一些特殊情境的数据很难找到,即使能够找到,因为数量要求巨大也会十分昂贵,于是,就出现了这样一批初创公司,它们通过算法自动生成人工智能公司所需的全面数据,帮助解决AI训练的一大难题。
一夜狂欢后在地铁里喝得酩酊大醉?在一次虚拟会议中感到无聊?在交通红灯前打瞌睡?一些公司正在开发软件,利用人工智能监测人们的行为,并解释他们在现实生活中、在网络世界中、甚至在元宇宙中的情绪和身体语言。但为了开发这种人工智能,他们需要大量假数据(即人造模拟数据),而初创公司正在帮助提供这些数据。
合成数据公司正在提供数以百万计的图像、视频、甚至音频数据样本,这些数据生成的唯一目的是训练或改进人工智能模型,这些模型可能会在未来成为我们日常生活的一部分,也有可能成为有争议的人工智能形式,如面部识别、情感人工智能和其他用于跟踪人们行为的算法系统。
合成数据公司Datagen的联合创始人兼首席执行官奥菲尔·祖克说,在过去,建立基于计算机视觉的人工智能公司往往依赖于公开可用的数据集,但现在,人工智能开发人员正在寻找定制的合成数据,以“解决越来越多的特定领域的问题,而这些特定领域几乎没有实际数据可供研究”。
包括Datagen、Mindtech和Synthesis AI在内的合成数据公司代表了一个日益分化的人工智能行业的一角。他们生产的人工智能部件最终将被组装起来,构建成应用程序中的软件和功能,或是车用系统。他们服务的客户包括为大型科技巨头、汽车制造商、游戏公司或手机制造商工作的计算机视觉工程师和数据科学家。
就像很多聚酯纤维一样,合成数据集的目的是模仿真实的东西。合成数据不只是复制实际的照片和视频数据,它通过增加特征和细节来丰富它,帮助人工智能进行系统学习。有时,合成的东西填补了真实数据不存在或难以获得的重要数据空白。它还可能提供用于训练自动驾驶汽车人工智能的危险路况,或者代表多个种族或年龄人群的面部图像,帮助人工智能做出公平和准确的决定。
由于缺乏多样化的人工智能训练数据,导致了人工智能的歧视问题,尤其是在面部识别方面,许多提供合成数据的公司将它们提供的产品奉为解决多样性问题的法宝。Synthesis AI的首席执行官亚沙尔·贝扎迪说:“我们通过提供涵盖各种年龄、性别、BMI(体质指数)和种族的合成数据,帮助客户减少AI的偏见。”
训练人工智能识别醉汉和作弊者
Mindtech公司的首席执行官史蒂夫·哈里斯说:“最近有一家公司来找我们,需要一种解决考试作弊的检测方案。”Mindtech是一家合成数据公司,通过逼真的计算机图形来设计和渲染数据图像。哈里斯不愿透露这个虚拟测试技术客户的名字,但他说,与其他许多虚拟测试技术公司一样,这位客户希望结合人工智能来监测应试者是否有作弊的迹象,比如说远离电脑屏幕、与人或手机互动等。
对于人工智能模型来说,要在各种人群、各种不同的环境中、发现可能的作弊迹象,它需要一个显示手、眼和身体运动的大型图像库来学习,这样的图像即使有足够的数量,购买的成本也会太高,还有可能涉及侵犯隐私的问题。哈里斯说:“当你把面部关键点数据和骨架姿势数据扔进去,来训练系统理解学生的目光朝向哪个方向,他们的身体即将转向哪个方向或他们的手朝向哪个方向时,情况就变得更加复杂。”
民主与技术中心报告说,用于检测虚拟考试作弊的人工智能系统对学生的隐私和心理健康构成风险,并可能歧视残疾人。
哈里斯说,客户还对使用合成数据来建立交通枢纽等公共场所的人工智能感兴趣。他说,有些客户需要数据来训练人工智能系统,以防止残疾人在火车站受到伤害,他说,例如,“有人喝醉了,离警戒线太近了”。
Mindtech最近发布了一套专门为零售环境设计的预置图像,可用于追踪顾客对特定产品的兴趣、跟踪商店货架上的库存、或预测停车场的交通流量。哈里斯说,在疫情暴发早期,Mindtech的客户希望用合成数据来训练人工智能,以监测是否符合口罩规定。
随着公司继续为了数不胜数的应用程序开发人工智能,投资者看到了合成数据制造商的光明前景。Mindtech去年获得了325万美元的融资。Synthesis AI在4月获得了1700万美元的A轮融资,Datagen在3月底的B轮融资中获得了5000万美元。
面部表情数据,帮助鉴别会议中的无聊情绪和司机分心
目前,合成数据帮助建立的很多人工智能被用于日常的、真实的情况,比如驾驶。合成数据正在帮助训练司机监控系统中的人工智能模型,这些系统通过仪表盘摄像头捕捉司机图像,并使用计算机视觉人工智能来检测分心,例如在送货车辆上。
Synthesis AI的首席执行官贝扎迪:“我们在这个领域有很多客户。”例如,Affectiva是一家AI系统公司,通过智能系统实时鉴别人们的情绪和认知状态,以检测司机是否有分心和路怒症等行为,Affectiva公司创始人拉纳卡里·乌比称,Synthesis AI向Affectiva公司提供了合成的面部数据。
贝扎迪说:“我们为Affectiva和其他驾驶者监测提供的数据主要是为了提高驾驶者的安全,检测像睡着了、不系安全带或分心等行为。我们相信,合成数据在减少死亡人数和改善整体安全方面可以起到积极的作用。”
在未来几年,基于人工智能的驾驶员行为评估系统肯定会更加普遍。欧盟委员会已将分心和瞌睡识别功能作为今年新车的强制性功能。同时,美国的《2022年基础设施法案》中预留了资金,用于研究司机监控系统,尽量减少司机分心带来的安全隐患。
合成数据也在为监控工作场所的人工智能提供支持。Datagen的最新产品可以让客户建立带注释的、每秒钟30帧的图像,用于办公室、会议和线上会议。祖克说,新数据可能被用来训练人工智能,以检测员工在工作会议期间是否感到无聊;例如,它包括显示人们用手抱头的图像数据。
目前,基于人工智能的评估人们情绪状态的功能已经出现在虚拟教室平台,甚至销售会议软件中,但合成数据还没有被大规模用于训练这种系统。
人权倡导者们反对在日常技术中使用情感人工智能。超过25个组织(包括“美国公民自由联盟”、“电子隐私信息中心”和“为未来而战”等组织)于周三致函Zoom公司创始人兼CEO袁征,要求公司停止将情感人工智能纳入软件功能的计划。这封信和“为未来而战”之前的努力,这是由于今年4月在Protocol上报道了Zoom可能计划将情感人工智能纳入产品而引起的。
这些团体写道:“这种软件具有歧视性和操纵性,并存在潜在危险,它是建立在所有人都使用相同的面部表情、声音模式和身体语言的错误假设上的。
Mindtech公司的哈里斯说,建立下一代办公和会议软件的公司,对通过监测人类互动来“标记看起来不寻常的东西”很感兴趣。他说,他预计像Meta和谷歌这样的公司会在他们创造的虚拟环境中加入这种类型的跟踪人工智能,但他补充说,“还有很长的一段路要走。”
对于人工智能来说,要捕捉到人们是否集中精力,或在开会时有没有注意老板,它通常需要识别面部表情。贝扎迪说,Synthesis AI的数据集包括数以百万计的图像、反映了150个面部“微表情”图像之间的细微差别。客户使用Synthesis AI的数字系统提交定制数据的请求,然后系统会自动渲染他们订购的内容。
贝扎迪说:“客户会说,‘我需要一百万张涵盖所有不同特征的图像’,结果可能是数以千计的面部图像,有各种肤色、发型、帽子、眼镜等特征。”
贝扎迪表示,多样性还表现在图像的照明方式上,如果Synthesis AI正在制作用于增强现实环境的数据,系统将产生多个版本的人或物体的图像,例如,桌子上的一杯咖啡在不同方向的光线下的图像。他说:“所以当我渲染这个图像时,它是在一个真实的场景中。”
离伦理问题只有一步之遥
Affectiva公司创始人乌比称,Affectiva使用合成数据来代表不同年龄段和种族的人,以增加数据集的多样性。仅仅拥有大量跨文化的面孔可能还不足以训练人工智能,因为人工智能还需要学习人们戴球帽时的样子、处于警觉状态或睡觉时的样子、在光线不足或明亮环境中的样子。她说:“要扩大这个规模,真的非常复杂且昂贵。”
但是,随着合成数据公司推动多元化的使命,他们的产品可能被用来建立有争议的人工智能形式。情感人工智能的合法性受到了研究人员的质疑,他们认为,无论是人类还是机器都无法根据面部表情准确地检测人们的情绪。而且一般来说,监测人们的面部表情、走路或说话方式的算法系统助长了不必要的监视,并可能被用来不公平地惩罚人们。
然而,在某些情况下,合成数据供应商与将使用其数据制造的产品之间的关系是非常紧密的。
由于人工数据是自动生成的,合成数据带有一些嵌入的元数据,描述图像和视频的细节,这是帮助人工智能模型学习所必需的。在Datagen公司的案例中,公司会包含显示面部表情强度的标签,如“微微一笑”或“非常高兴”,但也允许客户添加自定义标签。
Datagen首席技术官兼联合创始人吉尔·艾尔巴兹说:“Datagen正在通过消除注释训练数据和手动注释的需要,推动人工智能的进步。” Datagen没有说它是否限制它的客户类型,只是说它“专注于商业计算机视觉的应用,使人工智能团队能够开发安全、以人为本的数据”。
但其他合成数据公司将一些数据标签的决定留给他们的客户,并与他们帮助制造的最终产品保持一定的距离。Synthesis AI没有提供定性标签,如将面部表情归类为困惑或无聊等,而只是用技术信息对面部图像进行注释。例如,一个图像标签可能这样的元数据信息:左侧嘴角向上移动了10度,但不会标记为“略微高兴”。
虽然贝扎迪说Synthesis AI已经拒绝了那些想在未经同意的情况下使其数据来识别人的客户,但他说公司没有拒绝那些想要数据来训练情感AI模型的潜在客户。
Mindtech将标签和最终产品的决定权留给了客户。Mindtech的产品管理副总裁克里斯·朗斯塔夫说:“我们理解面部表情是非常主观的,所以我们允许客户自行决定他们想使用的标签。”他表示,客户的保密性使Mindtech无法知道用其数据制造产品的细节。
在不久的将来,预计会有更多的合成数据被创建出来,因为它们是新兴虚拟环境构建各种AI的基础。Mindtech公司的首席执行官哈里斯说:“合成数据有可能成为元宇宙公司的一个重要工具。”
贝扎迪说,他预计与元宇宙相关的合成数据需求将在明年急剧上升。Synthesis AI表示,有一位客户希望把体育赛事在元宇宙环境中进行实时数字转化,它们正在与这位客户合作。
贝扎迪说,在未来,“我可以通过汤姆·布雷迪(美国职业橄榄球运动员)的眼睛来观看比赛”。