这次真的不一样，数学正在经历历史上最大的变革_系统生成_推理_问题

麦站管理员 50 2026-04-19 09:15:01

内容页头部广告位（PC）

内容页头部广告位（WAP）

人工智能如今可以生成证明、探索思想并解决问题。剩下的工作是决定哪些问题值得关注。

一名研究生坐在屏幕前，盯着一个通常需要数小时才能解决的问题。这不是一个琐碎的问题，但也不是一个重大的开放性问题，而是介于两者之间的那种练习，测试你是否真正理解了这门学科。

学生没有从纸上开始，而是输入了一个提示。

几秒钟后，系统生成了一个大纲。它提出了一种策略，介绍了一个引理，勾画出了证明的框架。部分内容看起来是正确的，部分内容不太清楚，有一步似乎很可疑。

学生现在面临的是一个不同的任务。不是“从头解决问题”，而是“决定该相信什么”。

他们检查论证，重写其中的部分，测试小案例，再次询问系统，调整提示。这个过程变成了一个循环，生成、验证、修正。

一个小时后，问题解决了。

但这个经历与以往不同。工作并非从零开始，也没有按部就班进行。它既不是完全由人类完成的，也不是完全由机器完成的。

数学思维的结构发生了变化。

变化正在发生

几个世纪以来，数学一直是人类思想最清晰的表达之一。它是证明、严谨、抽象和耐心推理的学科。数学家可以花上几个月，甚至几年，逐步推进一个问题，仔细构建论证，每一步都能经得起审查。

这种画面开始发生变化。不是因为数学变得不再严谨，也不是因为证明不再重要，更不是因为人类智慧突然变得无关紧要。

它在变化，因为人工智能进入了这一领域，不仅仅作为一个快速计算器或符号助手，而是作为一个系统，至少在某些有限和不均匀的方式上，现在能够参与到数学推理的工作中。

如今，AI系统可以解决高难度的竞赛问题，协助证明，形式化论证，生成实验代码，探索庞大的例子空间，发现隐藏的模式。

围绕这些进展，仍然有很多炒作，也有很多误解。但在噪音的背后，真正的变化正在发生。数学进入了一个新时代。

数学曾经的模样

我们许多人心中都有一个传统的数学形象。一个人独自坐着，手拿纸张、粉笔，或许是黑板。他们深思熟虑，测试自己的想法。大多数想法失败，少数存活下来。最终，经过艰苦的努力，一个证明出现了。

这个画面并非虚***，它仍然描述了大量的数学工作。但它一直是不完整的。

数学从来不仅仅是孤独的天才。它还依赖于符号、书籍、通信、研讨会、计算、例子、图表、猜想、失败的尝试，以及越来越多的软件。从这个意义上来说，数学早就被工具塑造过了。好的工具不会取代思考，它们会重塑思考。

计算机做到了这一点。符号代数系统做到了这一点。数值计算做到了这一点。证明助手也做到了这一点。

而如今，AI以不同的规模做到了这一点。

改变对话的时刻

2024年，谷歌DeepMind开发的一个AI系统达到了一个里程碑，这在不久前看起来似乎不现实。

这个名为AlphaProof的系统能够解决国际数学奥林匹克（IMO）银奖得主水平的问题，IMO是数学中最具挑战性的竞赛之一。这些题目需要多步骤的推理、创造力，以及能够将不同领域的想法结合起来的能力。这个AI系统解决了2024年IMO中的六道题中的四道，总得分28分，距离金奖门槛仅差1分。

数十年来，达到这个水平被视为非凡人类才华的标志。

这次的不同之处在于，AI不仅仅给出了答案。它提供了有效的数学论证，形式上可以逐步检查。结果不是猜测，也不是模式匹配。它更接近于一个证明。

这并不意味着该系统以人类的方式理解数学。但它显示了AI已经跨越了一个门槛。它不再局限于计算，它现在至少在某些情况下，可以在数学推理的结构内操作。

这次不同

计算机已经协助数学家数十年，执行比人类更快的计算，测试大量的案例，检查冗长的推理链。四色定理的证明之所以成名，是因为它依赖于计算机对成千上万种配置的验证。这些案例的数量庞大，以至于没有人类能够手工检查它们，计算机代替了人类完成这项工作。

然而，新一代AI系统远不止于算术或符号操作。它们可以阅读数学文本，生成证明草图，通过代码探索例子，搜索文献，提出类似于实际研究的推理路径。

它们仍然不完全可靠，仍然会产生自信却错误的结果。但它们不再局外，它们已经是数学的一部分，尽管不是处于核心位置。这就是为什么数学家既感到兴奋又感到不安的原因。

变化的速度

部分原因在于速度。就在不久前，人们会指出AI的初级错误，认为它在数学上的能力本质上是弱的。一个模型可能犯低级的算术错误，混淆符号，或者产生虚***的论证。这种情况曾经发生过，而且仍然会发生。但现在，如果我们只关注这些错误，就会错失更大的图景。进展如此迅速，甚至两年前的例子现在看起来都已经过时了。

真正的问题在于，AI开始自动化某些类型的专家级例行工作。这并不意味着AI突然能够按需生成深刻的概念性革命。它意味着AI越来越能够执行以前需要有知识的专家来完成的任务：检查案例，应用已知技术，生成相关的计算，提出可能的证明策略，或执行那些虽然真实但不特别具有创造性的技术步骤。

换句话说，AI正在进入一个以前完全属于训练有素的专家的数学领域。这就是为什么反应如此强烈。因为一旦工具进入了某个职业的认知核心，人们就会立刻开始质疑这个职业本身是否正在被削弱。

明确表达的恐惧

这种恐惧有许多表现形式。有些人说，数学将主要变成提出问题，而AI做工作。还有人担心研究会消失，学术界将主要集中在教学上。更极端的观点认为，AI是对数学家们的生死威胁。

这些担忧很容易被忽视，但它们并非无关紧要。如果机器能够解决那些曾经需要多年训练的问题，那么这种训练的价值将何在？如果它能生成证明，测试想法，探索案例，比任何人都快，那么剩下的独特人类工作是什么？

这些问题超出了职业范围。对许多人来说，数学不仅仅是一组技巧。它是思维的方式，是意义的源泉。数学可能部分被机器取代的可能性，不仅仅是令人不安的，它是非常个人化的。

所以，这种恐惧并不是不理智的，但它并不完全。

陶哲轩的观点

在这个话题上，最有深度的声音之一是陶哲轩，他以冷静和理性的态度来看待这件事。他既没有轻视AI，也没有浪漫化它。他的一个关键区分是“广度”与“深度”之间的区别。

陶哲轩（1***5年出生），菲尔兹奖得主，是我们这个时代最具影响力的数学家之一。

人类，尤其是数学专家，在深度上更具优势。他们坚持处理一个困难的想法，精炼它，构建直觉，逐步构建论证。相比之下，AI系统通常在广度上更强。它们可以迅速探索许多方向，测试变体，扫描大范围，即使大多数尝试最终都没有结果。

如果数学是一个景观，AI可以快速勘测，映射许多可能的路径。而人类数学家则是跟随一条路径走到底，理解它的走向和意义。

这种区别在进展的方式上得以体现。人类的进步往往是渐进的，随着时间的推移构建出结构。AI则倾向于跳跃。有时它能够找到正确的路径，有时它会生成看起来合理的片段，但缺乏连贯性。它还无法像人类合作者一样，可靠地积累理解。

陶哲轩的观点并不是AI很弱。在某些方面，AI的确很强。关键在于它的强项不同。

一种新的工作方式

如果AI在广度上特别强，那么数学可能开始在结构上发生变化。

AI系统可以扫描大量问题集，测试已知技术，生成例子，探索变化，编写代码，提出可能的路径，这些都远远超出了人类的能力范围。然后，研究人员可以在需要解释的地方介入，在想法必须被判断、精炼和连接成有意义的东西时进行干预。

这一点已经开始发生。现在的问题不再主要是生成想法，而是在随之而来的工作中处理它们。问题变成了信息过载。我们如何在大量看似可信但不可靠的输出中，发现真正的进展？我们如何区分深层结构与表面模式？

瓶颈已经转移。挑战不再是生成想法，而是识别哪些才是重要的。

当证明不再足够时

这里还有一个张力。AI系统很擅长看起来是正确的，但这并不等同于它们真的正确。

在数学中，这种区别非常重要。错误的证明并不是接近成功，它就是错误的。当前AI特别棘手的地方在于，它的错误往往不那么显眼。一个证明可能看起来很完美，使用了正确的术语，但仍然包含一个微妙但致命的错误。

人类学生也会犯错，但错误的类型不同。AI的错误往往是结构上令人信服的，但逻辑上却空洞，这使得它们很难快速被发现。

这也是像Lean这样的正式证明系统变得尤为重要的原因。Lean是一个证明助手软件系统，在这个系统中，数学命题和证明被用精确的形式语言书写，这样每一个逻辑步骤都可以被计算机检查。它提供了一种将生成与验证结合的方式：让AI提出，让系统进行检查。

正式化如何改变证明

这一点需要特别强调，因为它可能看起来比较技术性，但它并不只是技术性的问题。

传统的数学写作留下了许多隐含的部分。专家们知道哪些步骤是常规的，哪些是细腻的，哪些才是做实工作的部分。正式证明系统迫使每一个步骤都以显式的形式出现。这可能感觉繁琐，但它也改变了可见的东西。一旦证明被完全正式化，就可以以一种普通的表述往往无法揭示的方式检查其内部结构。

这开启了一个有趣的可能性。未来的数学家可能不仅仅是证明定理。他们可能还需要分析由机器生成的证明，识别真正的新引理，提取其中的基本策略，并将整个论证重新编写成一个更清晰的概念框架。从这个意义上说，可能会出现一个专门的数学工作层，致力于压缩、解释和概念上的提炼。

一个巨大的证明并不等同于理解。但一旦证明存在，就可以进行研究、改进、重组，也许最终转变成某种优雅的形式。

AI会发现真正的新数学吗？

这是每个人都会问的问题，诚实的答案是我们还不知道。

应用已知技巧的规模与创造真正的新数学之间是有区别的。许多问题可能仅仅是因为没人尝试过正确的现有方法组合而得到解决。如果AI能够高效地探索文献，它可能会解决许多这样的情况，清除那些被忽视而非深刻的问题。

但最难的问题之所以无法解决，往往是因为现有方法走了一部分路却失败了。剩下的部分通常需要一个新的视角，一种新的语言，或者是不同领域之间的意外联系。

AI能做到吗？也许有一天能做到。现在尚不清楚当前的系统是否能够建立这种突破所需的累积概念结构。它们能够重新组合已知的策略，有时能找到令人惊讶的路径，但真正的突破不仅仅是一个结果，它是对思维的重组。

这可能比看起来更难以自动化。

人类能做什么？

讨论往往变得过于悲观或过于模糊。

一个常见的担忧是，如果AI接管了更多的技术工作，数学家们会变得不再重要。但这***设了数学劳动与数学价值是完全相同的。历史表明，情况并非如此。当计算器、符号系统和数值软件接管了例行任务时，数学并没有消失。它转移到了更高的层面。人类的角色转向了建模、解释、战略和抽象。

同样的事情可能会再次发生，而且会在更高的层面上。未来的数学家可能会花更少的时间在例行的推导上，更多地时间用在问题的框定、判断哪些想法重要、从大规模探索中提取结构，以及跨领域连接概念。他们将越来越多地在结合计算、正式证明和AI辅助探索的混合环境中工作。

这一转变在课堂上已经开始显现。如果AI能够解决标准问题集，那么解决问题就不再是重点。重点转向了解释、判断和理解，不仅仅是证明结果是正确的，而且要知道它为什么有效，在哪些情况下适用。

风险是真实的

然而，乐观的故事并非注定会发生。确实存在真实的风险。

机器生成的论文洪流可能会淹没同行评审。虚弱或误导性的结果可能会比社区能够评估的速度更快地传播。年轻研究者可能会变得过于依赖他们并不完全理解的工具。如果数学碎片化为机器生成的技术输出加上人类总结，那么优雅的阐述可能会下降。如果AI系统变得强大，但被封闭起来，那么前沿数学的获取可能会变得更加不平等，而不是更加民主化。

这些是结构性的问题。数学的未来不仅仅由AI能做什么来决定。它还将由数学界如何围绕这些工具进行自我组织来决定。

即使存在这些风险，转变的规模仍然是显著的。

这是数学历史上最大的一次变革吗？

这是一个戏剧性的说法，但或许并非不合理。

符号化符号的引入改变了数学。微积分改变了数学。严格的基础改变了数学。数字计算改变了数学。正式证明系统改变了数学。

AI可能最终会属于这个名单。并不是因为它为我们证明每个定理，也不是因为它让数学家变得不再必要，而是因为它改变了探索与验证之间的平衡，改变了常规技术与概念性洞察之间的平衡，改变了人类深度与机器广度之间的平衡。

它可能会改变问题的选择方式，证明的写作方式，猜想的形成方式，学生的训练方式，文献的搜索方式，以及合作的方式。这不是一种局部调整。这是数学生态系统的转型。

剩下的问题

或许最有趣的问题不是AI是否会做数学。某种程度上，它已经在做了。

更深层次的问题是：在一个正确的步骤变得便宜、可能性丰富且验证部分自动化的世界里，哪种数学会变得更加重要？

机器可能会成为强大的工具，甚至可能成为强大的合作者。但寻找理解的过程，不仅仅是知道某件事是否为真，而是知道它为何属于更大的结构，这仍然深深地人性化。

也许这正是数学，即使在它转型后的未来，依然能保持最为生动的地方。返回搜狐，查看更多

内容页头部广告位（PC）

内容页头部广告位（WAP）

标签：

评论记录：

未查询到任何数据！