中国从事人工智能的研究员数量与美国一样多,但在机器学习等关键领域落后,政府希望能在关键领域迎头赶上。
在北京一个繁忙十字路口旁的低层大楼里,戴着细框眼镜、留着一头黑发的中年科学家文继荣兴奋地描述着一个在人工智能领域中的热门项目。
文继荣在北京智源人工智能研究院带领一个团队,这个由政府资助的研究实验室正在测试一个强大的新语言算法,它与自回归语言模型GPT-3(由旧金山的人工智能公司OpenAI开发,目的是为了使用深度学习分类或产生人类可以理解的自然语言)相似。
今年6月,OpenAI 的研究人员透露说,该程序可以消化大量的文本,并能生成非常连贯、自由流畅的语言。
“这是一个大项目,” 文继荣笑着说,“它需要大量的计算设备和资金。”
文继荣是北京人民大学的教授,也在北京智源人工智能研究院兼职工作,他希望创造出一种比GPT-3更好的算法。他计划把机器学习和数据库合二为一,并用于算法图像、视频以及文字,以便创造出一个丰富的物理世界。
这样猫和皮毛两个单词,就不只是经常出现在同一个句子中,在视觉上它们也能彼此相联。包括OpenAI在内的其他顶级人工智能实验室也在做类似的工作。
吸引文继荣来研究院的原因之一是它拥有大量的计算资源。他说:“研究院得到了政府的大力支持,拥有强大的数据和计算能力。”
他研究的语言模型是众多研究院项目中的一个,该模型旨在从根本上推进人工智能的发展,体现了中国科技的新时代。尽管对中国的技术崛起有很多报道,但迄今为止中国更擅长吸收创新并加以改良。这一点在人工智能领域尤为明显,中国领导人认为人工智能对他们增强国力至关重要。
研究院的一些技术突破可能会对政府有益。
文继荣说,他的语言系统可以作为智能助手帮助公民在网上办理一些业务,如获得签证、驾照或商业许可证。智能助手可以引导市民完成繁琐的手续,避免了在填写文件和排队上浪费时间。该项目的负责人刘占亮曾在中国最大的网络搜索公司百度担任工程师,他表示团队已经为北京市机动车管理局设计了一个智能系统,他说:“这真是一个艰巨的挑战”。
当然,政府也可能在其他方面受益。高级的人工智能语言系统可用于搜索社交媒体上的不当言论或通话记录。中国政府已将人工智能用于公共管理,例如审查和监督制度。研究院的成果是否应用于警务或情报工作尚不清楚,但个人可公开申请将成果应用于商业途径。
与此同时,官员们对人工智可能会侵犯国家权力而心存警惕。该研究所的几个项目旨在为人工智能的商业化运用设置规定,以避免伦理问题并遏制大型科技公司的权利。
新书《大脱钩》的作者奈杰尔·英克斯特说:“中国政府正试图规范人工智能的运用,但我认为这并不容易。” 书中讲述了中美关系的破裂。
一个雄心勃勃的人工智能计划
2017年,政府在一份计划中明确表达了其在人工智能领域的雄心。它为人工智能研究人员设定了“到2025年取得根本性突破”的目标,并期望中国“到2030年成为世界主要创新中心”。
一年后,研究院在北京中关村成立。与波士顿和硅谷等美国创新中心相似,中关村是北京的创新园区。这里有几家借鉴西方运营模式而获得成功的大型科技公司,比如个人电脑制造商联想和搜索引擎搜狗,还有无数廉价的电子产品商店。
近年来,电子产品商店逐渐消失,数十家初创企业如雨后春笋般涌现,它们在制造业、机器人、物流、教育、金融和其他领域中寻找应用人工智能的途径。
今年晚些时候,研究院将搬入附近的一座新大楼。这个地点既具有象征意义又很便利,它距离中国两所顶尖大学清华大学和北京大学及中关村集成电路园都很近。去年政府为吸引本土芯片企业而设立了中关村集成电路园。
新冠疫情中断了我去中国的行程。以前我见过一些在研究院工作的学者,也通过网络会议Zoom平台和在研究院工作的其他人聊过。一位行政助理通过微信视频功能带我参观了研究院。
透过小屏幕,我看到工程师和后勤人员坐在一间开放式办公室里,周围是郁郁葱葱的盆栽植物。前台的墙上挂着标明研究院各个部门的指示牌,包括智能信息处理部和人脸识别部。一个大牌子上写着研究院的理念:学术思维,基本理论,高级人才,企业创新,发展政策。
研究院的一个小组正在探索支持机器学习算法的数学原理,这可能有助于改进这些算法。另一个小组专注于从神经科学中获取灵感以构建更好的人工智能程序。目前最著名的机器学习方法即深度学习,其灵感来源于人脑中神经元和突触的输入式学习方式。深入理解动物和人类认知的过程可能会带来新一代升级版的智能机器。第三个小组专注于设计和开发微芯片,以期更有效地运行人工智能程序。
研究院的许多研究人员正在从事前沿技术工作。有研究员在研究如何让深度学习算法更高效且更紧凑。还有人在研究 “神经形态”的计算机芯片,它通过模拟生物认知过程而从根本上改变计算机的工作方式。
中国拥有一些顶尖的人工智能学术人才,但与美国、加拿大或一些欧洲国家相比,其顶尖专家仍然较少。
去年6月,保尔森研究所发布了一项关于人工智能研究论文的调查,结果显示中美两国每年培养的人工智能研究人员在数量上大致相同,但最终绝大多数研究员都在美国工作。
最近,特朗普政府在高端微芯片出口上对中国实施制裁,这令中国更加迫切地需要发展人工智能领域。美国这一举动明显是针对华为公司,它指控华为向政府提供数据并切断为华为旗下高端智能手机供应芯片。
2019年,美国扩大了对中国的制裁,禁止美国公司与几家中国的人工智能公司做生意,并指责它们为国家监控提供技术。拜登可能会采取与特朗普不同的方式,但他不可能忽视中国在科技方面的潜在威胁。
研究院主任黄铁军在思考良久后谨慎地表达了他的想法,他认为该院为推动人工智能发展而借鉴了西方研究机构中跨学科的发展模式,尽管目前中美关系紧张,但研究院需要与西方的研究机构保持联系。
研究院已派出研究人员访问了加拿大的蒙特利尔学习算法研究所和英国的图灵研究所,这两所研究中心汇聚了全球一流的人工智能专家。来自普林斯顿大学和加州大学伯克利分校等美国机构的人工智能科学家是该研究院咨询委员会的成员。
中国政府不是唯一投资人工智能领域的国家,美国国防部高级研究计划局支持具有潜在军事用途的人工智能研究。然而,许多西方国家对中国政府如何利用技术来促进其发展持谨慎态度,例如将数字技术与“一带一路”倡议结合起来,该倡议旨在与周边国家建立经济和基础设施方面的联系。受中国政府支持,研究院的工作具有更宏观的意义。
从技术标准来看,研究院的研究成果或许可作为衡量软实力的工具。一些在华留学的西方学生认为,政府制定标准是一种有利于国企发展并规范技术内涵的方式。
中国公司积极地为先进的5G移动网络技术制定标准。研究院的一个研究小组专注于制定人工智能技术的标准,他们在7月发布了一篇关于拟定机器学习符号的文章。
一些西方研究人员表示中国在人工智能领域的投入并不罕见。
剑桥大学莱弗哈姆智能未来中心研究员丹尼特·加尔从事人工智能的伦理研究,此前她曾担任联合国技术顾问。研究院成立时,加尔正在北京大学学习并参加了几次研究院的会议。她认为在研究院认真做研究时,外部却把焦点放在有争议的问题上,这种做法是不公平的。
“中国的监督制度并不是中国独有的。” 她说, “我来自以色列,以色列的监控和边境都是由微软掌控的(微软投资了以色列AnyVision公司,该公司开发的面部识别软件被用于约旦河西岸的检查站,但微软在2020年3月表示其将剥离股权)。”
黄铁军和研究院的其他人表示,国际研究人员应该与该研究院合作,从而间接地影响中国政府。
“研究院是一个平台,它把来自不同国家、有着不同答案、不同背景和不同观点的人聚集在一起,大家通过交流可以增进对彼此的了解。” 黄铁军说。
在胡佛研究所研究中国问题的格伦·蒂夫特表示,这种参与是有意义的,但重要的是要了解更广泛的研究背景。
“我绝对不赞成中美关系脱钩,”他在谈到研究院的工作人员和研究人员时表示,“他们可能是可敬的人、有诚信的人,但重要的是它背后有政府支持。”
监督民营经济
2019年夏天,在疫情开始之前我拜访了北京自动化研究所的一名研究员,他现在是研究院的关键成员。自动化研究所也位于中关村,它入口处的照片证明了中国一直以来对技术创新的兴趣:黑白照片记录了毛主席与科学家们的会面,彩色照片记录了中国现任领导人与科学家们的会面。
曾毅是自动化研究所的一名新研究员,也是研究院人工智能伦理与安全研究中心的主任。他的团队代表北京市政府制定了一份应用人工智能的道德规范。目前该规范是自愿遵守的,它提出人工智能不应存在歧视、不应在使用时存在安全风险、终端用户可以在人工智能系统有不当行为时选择退出。
曾毅给我看了一张由不同国家的公司和政府制定的47条人工智能道德规范的图表。他表示,他的团队希望与全球的研究人员一起讨论人工智能偏见和隐私保护等问题,但他未提及有关政府监控的问题。
一些中国学生认为,中国实际上正在与使用人工智能算法的私人企业就伦理问题开展博弈,这点与西方国家殊途同归。
去年11月,政府监管部门阻止了阿里巴巴旗下的金融科技公司蚂蚁集团在香港和上海上市。政府还表示,将调查阿里巴巴可能存在的滥用反垄断行为。《大脱钩》图书的作者英克斯特表示,政府正在“提醒中国民营经济它们的存在是受政府监督的。”
中国政府正在起草一项重要的新隐私法,该法将限制公司可以收集和使用的数据,但同时也加强了国家为执法和监督而获取数据的权限。研究院正在进行的一些工作也为疫情提供了帮助。为应对疫情,研究院的一个团队开发了一款蓝牙程序用于追踪新冠接触者,它在不收集身份信息的情况下提醒人们可能接触到疫情的危险性。研究院的发言人表示,已在中关村附近的几个办公室测试了这一程序。
伦敦政经学院教授诺姆·尤特曼发表的一篇论文采用了来自中国的数据,他表明人工智能可以从国家干预中获得独一无二的好处,因为人工智能算法非常渴望获得大量数据和强大的计算机支持,而这些是政府可以提供的。
但他补充说,这种快速发展和不可预测的技术也可能给政府带来问题。他说:“创新的本质就是不确定性,也许没有什么事物比人工智能更具有不确定性。”