logo
繁体
繁体

一个著名的数学难题让人类困惑了80年,AI刚刚给出了答案,数学家们震惊了

本文刊发于华尔街日报专刊,作者本·科恩为《华尔街日报》撰写“成功的科学”专栏。

数学界正因埃尔德什问题的新解法而炸锅,报道解释了AI 到底发现了什么,这件事为什么重要。

世界顶尖数学家之一最近写道:“如果你是数学家,继续读之前,你最好确认自己已经坐下。”

如果你不是数学家,那你更需要坐下。

因为一道困扰人类近一个世纪的著名数学难题,终于被攻克了,出手的是 AI。

不久前,最先进的 AI 模型连基础数学都做不好。到了去年,它们已经能在国际数学奥林匹克竞赛中达到金牌水平。

现在,这引起AI开始用代数数论解决组合几何中的经典问题。人工智能几乎是在一瞬间,从愚笨变得聪明到令人不安。

不过,当 OpenAI 宣布它的一个模型,在没有任何人类在黑板上写下一堆方程的帮助下,解决了一个名为单位距离问题的谜题时,就连数学家也震惊了。

输入给它的提示是:

它输出了这份证明:

整个数学界都炸了锅。

对于不熟悉数字的人,OpenAI 还请知名数学家写了 19 页配套评论,帮助解释这一发现。

一般来说,数学家对企业的炒作有严重过敏反应。他们在愿意接受基本事实之前都要求证明,更不用说关于全新突破的说法。

许多数学家一直怀疑 AI 会不会彻底改变他们的行业。

所以,看到下面这些话格外令人吃惊。

普林斯顿大学教授诺加·阿隆说:“AI 在这里完成了许多优秀人类研究者尝试过却没有完成的事情。”

多伦多大学助理教授丹尼尔·利特说:“这是第一个由 AI 自主产出的结果,我认为它本身就令人兴奋,而不只是某种先行信号。”

法兰西公学院教授蒂莫西·高尔斯说:“毫无疑问,单位距离问题的解答是 AI 数学领域的一个里程碑。如果这篇论文是人类写的,并提交给《数学年刊》,而我被要求给出快速意见,我会毫不犹豫地建议接收。此前没有任何 AI 生成的证明接近这个水平。”

最后这份背书尤其有分量,因为高尔斯是菲尔兹奖得主。菲尔兹奖是人类数学家所能获得的最高荣誉之一。

高尔斯接着说,即便 AI 不再变得更聪明,我们也已经进入一个新时代。他说:“人类将很难在解决数学问题上与 AI 竞争。”

只看公式就足以让我头疼,但我还是想更多了解 AI 到底发现了什么,我们人类为什么错过了它,以及这次突破对我们这些希望永远远离数学题的人来说究竟有什么意义。

采访 OpenAI 员工时,他们告诉记者,这个结果如果放在一年前,听起来会完全疯掉。

研究员塞巴斯蒂安·布贝克说:“别说一年前了,一个月前都不可能想象。”

所以可以想象,80 年前这件事会多么不可想象。当时,单位距离问题由保罗·埃尔德什提出。埃尔德什被称为历史上最高产的数学家。他也以古怪、四处漂泊的天才形象闻名。

他常年拖着行李箱生活,昼夜不停地工作,走遍世界各地,践行自己的个人格言:“换一处屋顶,换一个证明。”

除了研究成果,他还留下了一大批后来被称为埃尔德什问题的题目。这些问题已经成为衡量数学进展的标尺。

从他愿意为某个问题的解答出多少钱,就能看出他有多喜欢那个问题。单位距离问题是他最喜欢的问题之一。最初,这个问题的奖金是 300 美元,后来埃尔德什把奖金提高到 500 美元。

埃尔德什不只是给数学题标价。他还把数学题分成两类:棉花糖,也就是“提供短暂愉悦的美味小点心”;橡子,也就是“需要深刻而微妙的新洞见,能由此长成参天大树”的问题。

单位距离问题就是一颗巨大的橡子,而 OpenAI 想把它敲开。

单位距离问题最简单的版本大致是这样:如果你在一张纸上放 n 个点,那么有多少对点之间的距离可以正好等于一个单位?

编注:你可以把这个问题想成这样,在纸上随便画很多个点,点的总数用 n 表示。然后检查这些点两两之间的距离。只要两个点之间的距离刚好等于 1 个单位,比如 1 厘米,就算作“一对”。

问题问的是:最多能有多少对这样的点?

比如,如果只有 2 个点,而且它们之间正好相距 1 厘米,那么答案就是 1 对。如果有 3 个点,摆成一个边长为 1 厘米的等边三角形,那么每两个点之间都相距 1 厘米,所以一共有 3 对。如果有 4 个点,摆成一个边长为 1 厘米的正方形,那么四条边上的点对距离是 1 厘米,所以有 4 对;但两条对角线的距离不是 1 厘米,所以不算。

“单位距离问题”的核心不是问某一组点有多少对,而是问当点的数量非常多,也就是 n 很大时,怎样摆放这些点,才能让“相距正好为 1”的点对尽可能多?最多大概能多到什么程度?

埃尔德什在 1946 年证明,把这些点排成网格可以产生一定数量的点对。他的猜想是,没有哪种排列方式能明显做得更好。OpenAI 的模型找到了一种做得更好的排列。换句话说,这份证明其实是一份反证。

OpenAI 的研究人员也惊呆了。他们把这个埃尔德什问题交给内部模型,是为了测试它的能力,看看它是否比以往模型更强。等他们看了一眼解答后,才知道它到底强了多少。

OpenAI 的哥伦比亚大学数学家梅塔布·萨尼说:“我一开始并不相信。”

于是他们开始寻找错误,请外部专家核验结果,还用公司的 AI 编程代理检查 AI 的工作。

萨尼说:“读得足够多,也用 Codex 检查得足够多之后,它看起来可信,而且相当了不起。”

早在 AI 出现之前,解出埃尔德什问题的数学家常常会把奖金支票装裱起来,而不是拿去兑现。对他们来说,钱不如荣誉重要。

为什么 AI 能在人类失败的地方成功?

为海外华人提供可靠的信息和分析。如果想看更多内容与即时更新,可以在 Bluesky、Telegram、X 搜索「causmoney」,深度分析和评论也可以直接搜索「caus.com」。

第一个解释是,这个具体解法恰好非常反直觉。

大多数研究这个问题的人都试图证明埃尔德什的猜想,而不是推翻它。只有挑战传统看法,并尝试看似不太可能成功的策略,模型才找到了一条出人意料的前进路径。

第二个解释是,人类擅长专业分工,而 AI 擅长综合整合。

数学家往往专注于自己的具体专业领域,而 AI 模型可以利用庞大的知识,发现我们自己不可能看见的联系。在这个案例中,这意味着它同时调动了代数数论和离散几何的知识。这两个领域的共同点,大概就像马拉松和撑竿跳高一样少。

第三个解释是,AI 有时间、注意力、耐心、专注力,也有坚持某些方法的韧性,而人类可能早就放弃了。解开这个埃尔德什问题,恰恰需要这些东西。

OpenAI 的哈佛大学统计学家马克·塞尔克说:“这是一种你会先试一会儿、发现不管用,然后觉得也许自己只是太乐观了的想法。于是你放弃,然后转向别的问题。”

AI 不会转向别的问题。它会一直往前推进,不需要停下来吃饭、睡觉、回邮件、接孩子放学,也不用看尼克斯队比赛。

而且它可以长时间保持连贯思考。即使是模型“思维链”的删节版,也超过 7.5 万词,长度相当于第一部《哈利·波特》。

单位距离问题:n 个点,彼此之间正好相距一个单位。OpenAI

读完之后,OpenAI 前研究员粗略算了算,估计花费不到 32 小时,token 成本不到 1000 美元。对于这种级别的成果来说,这很便宜。

研究人员不愿确认具体时间和算力成本,但布贝克形容成本“真的完全不算疯狂”。

你可能觉得这一切疯狂得令人不安,也可能觉得它鼓舞人心,或者两种感受兼而有之。不过,OpenAI 内部的人对数学家的未来出人意料地乐观。

他们提到一些领域,在那里,曾经不可想象的技术进步提高了人类表现,从围棋棋手到国际象棋特级大师都是如此。他们说,就像计算器一样,AI 是一种工具,可以扩展我们的好奇心,而不是摧毁它。事实上,人类已经在这个解法的方法基础上继续推进,并利用它们解决其他长期存在的数学问题。

布贝克在 X 上写道:“突破的意义在于,它会突然让很多看似不可能的事情变得可能。”

当然,能够解决埃尔德什问题,并不等于拥有超人智能。晦涩的数学研究也不是癌症疗法。由 AI 驱动发现的奇迹时代,也还没有真正到来。

布贝克说:“公平地说,我们还没有看到那种可以归于人类历史上一些最伟大证明的天才火花。”

但也许我们应该习惯先坐下。公平地说,任何领域只要有等待解决的问题,AI 都完全有能力推动科学进步。

现在,已经有证明了。或者说,反证。