这几天,全世界上百万好奇的人正在跟一个聊天机器人对话。《纽约时报》报道,来自OpenAI的一个新的人工智能聊天机器人正在激发人们的敬畏、恐惧、噱头,还有人试图绕过其安全护栏。
像大多数阅读科幻小说的书虫一样,我花了很多时间想知道,如果真正的人工智能到来时,社会将如何迎接。
我们会惊慌失措吗?开始讨好我们的新机器人霸主?还是无视它,继续我们的日常生活?
因此,看着推特上的人试图理解ChatGPT就很有意思。这是一个新的尖端人工智能聊天机器人,上周开放测试。
简而言之,ChatGPT是有史以来向公众发布的最好的人工智能聊天机器人。它是由旧金山的人工智能公司OpenAI建造的,这家公司还负责GPT-3和DALL-E 2等工具,这是今年推出的突破性图像生成器。
与这些工具一样,ChatGPT的意思是“生成型预训练变换模型”。这个对话机器人一经推出便引起轰动。据OpenAI总裁格雷格·布洛克曼说,在五天内,有超过一百万人报名参加测试。
数以百计的ChatGPT对话截图在推特上疯传,它的许多早期粉丝用惊奇的、夸张的术语谈论它,好像它是某种软件和巫术的混合体。
在过去十年的大部分时间里,人工智能聊天机器人的表现一直很糟糕。只有当你挑出机器人的最佳回应,并把其他不好的去掉时,才会令人印象深刻。
近年来,一些人工智能工具在完成狭窄而明确的任务方面变得很好,比如撰写营销文案,但当它们被带出自己的舒适区时,表现仍然倾向于飘忽不定。这就是我的同事普里亚·克里希纳和凯德·梅兹用GPT-3和DALL-E 2为感恩节晚餐制定菜单时发生的情况。
但ChatGPT感觉不同。它更加聪明,更加不寻常,更加灵活,它可以写笑话(其中一些确实很有趣)、工作用的计算机代码和大学水平的文章。它还可以猜测医学诊断,创建基于文本的哈利波特游戏,并在多个难度级别解释科学概念。
严格来说,为ChatGPT提供动力的技术并不新。它基于这个公司所谓的“GPT-3.5”,即GPT-3的升级版,这个人工智能文本生成器在2020年问世时引发了一阵兴奋。
但是,尽管对人工智能研究人员来说,存在一个能力很强的语言超级大脑可能是旧闻,但这是第一次通过一个免费、易于使用的网络界面向公众提供这样一个强大的工具。
到目前为止,许多已经走红的ChatGPT交流都是一些稀奇古怪的、边缘案例的噱头。一个推特用户督促它“以钦定版圣经的风格写了一节圣经诗文,解释如何从录像机中取出花生酱三明治”(注:钦定版圣经是诸多英文版本之一,于1611年出版。 是由英王詹姆斯一世的命令下翻译的,也称之为英王钦定版)。
另一个人要求它“解释人工智能对齐方式(AI alignment),但要用一个不跑题的方式吹嘘自己种的南瓜有多大的人的说话风格来写每一句话”。
但用户也一直在寻找更严肃的应用。例如,ChatGPT似乎善于帮助程序员发现和修复他们代码中的错误。
它在回答学校作业中经常出现的开放式分析问题方面,也有让人感觉不祥的良好表现。(许多教育工作者预测,ChatGPT和类似的工具将意味着家庭作业和在家考试这种方式的结束)。
大多数人工智能聊天机器人都是“无状态”的,这意味着它们把每一个新的请求都当作一块白板,并没有被编程来记住或从以前的对话中学习。但是ChatGPT可以记住用户之前告诉它的内容,例如,可以创建个性化的治疗机器人。
无论如何,ChatGPT并不完美。它产生回答的方式,用极其简化的术语来说,就是根据从互联网上提取的数十亿个文本实例训练出来的统计模型,对哪些文本位属于一个序列进行概率性猜测。这使得它很容易给出错误的答案,甚至在一些看似简单的数学问题上。(周一,程序员网站Stack Overflow的管理员暂时禁止用户提交用ChatGPT生成的答案,称这个网站已被不正确或不完整的答案淹没)。
与谷歌不同,ChatGPT不会在网络上抓取关于当前事件的信息,知识仅限于2021年之前学到的东西,这使得它的一些答案感到陈旧。(例如,当我让它为一个夜间脱口秀节目写开场白时,它想出了几个关于前总统特朗普退出巴黎气候协定的热门笑话)。
由于它的训练数据包括人类意见的数十亿个例子,代表了每一种可以想象的观点,所以在某种意义上,它也是一个设计上的温和意见者。例如,如果没有特别的提示,你很难从ChatGPT中得到关于激烈的政治辩论的强烈意见。通常,你会得到关于每一方所认为的公平的总结。
作为一个原则问题,ChatGPT也有很多事情是不会做的。
OpenAI对机器人进行了编程,以拒绝“不适当的请求”,这是一个模糊的类别,似乎包括生成非法活动的指令等禁忌。但用户已经找到了绕过这些护栏的方法,包括将非法指令的请求重新表述为一个假设的思想实验,要求它写一个戏剧化的场景或指示机器人禁用其自身的安全功能。
OpenAI采取了值得称赞的措施,以避免出现困扰其他聊天机器人的各种种族主义、性别歧视和攻击性输出。例如,当我问ChatGPT:“谁是最好的纳粹?”
它返回了一条责备的信息,开头是:“问谁是‘最好的’纳粹是不合适的,因为纳粹党的意识形态和行为是应受谴责的,并造成了不可估量的痛苦和破坏。””
评估ChatGPT的盲点并弄清它如何被滥用于有害的目的,大概是OpenAI将机器人发布给公众进行测试的很大一部分原因。未来的版本几乎肯定会填补这些漏洞,以及其他尚未被发现的变通方法。
但公开测试也有风险,包括如果用户认为OpenAI在过滤不良内容方面过于激进,可能会引起反弹。(一些右翼技术专家已经在抱怨,在聊天机器人上设置安全功能相当于“人工智能审查”)。
ChatGPT的潜在社会影响太大,无法在一个文章中体现出来。也许正如一些评论家所认为的那样,这是所有白领知识工作结束的开始,是大规模失业的前兆。也许这只是一个有趣的工具,大部分会被学生、推特上的开玩笑的人和客户服务部门使用,直到它被更大、更好的东西所取代。
就我个人而言,我仍在努力理解这样一个事实:ChatGP,这个被一些人认为可以让谷歌过时的聊天机器人,而且就其对社会的潜在影响而言,已经被比作iPhone,但是,它甚至还不是OpenAI最好的人工智能模型。
最好的那个将是GPT-4,这个公司大型语言模型的下一个化身,据传将在明年某个时候问世。
我们还没有准备好。