Google DeepMind新AI媲美国际数学奥林匹克金牌的解题能力

darthracer · 2024-2-9 12:41

Google DeepMind最近发布一款AI系统AlphaGeometry，使用1亿笔合成数据训练，就能在最新的30道国际数学奥林匹克（IMO）题目中，在规定时间内解出25道题。它不只比先前只解出10题的最佳AI还厉害，表现还接近人类金牌得主的平均值25.9道题，是迈向通用AI的一大里程碑。这项研究成果，日前也登上《Nature》期刊。

最先进的AI系统解几何学难题，仍是个挑战

为何AI解几何学题目很重要？

因为，几何学是数学最古老、最基础的分支之一，也是计算机科学、建筑、艺术、工程、天文等领域的重要工具。就计算机科学来说，几何学因涉及空间属性，例如距离、形状、大小和相对位置等，是重要的处理工具，尤其能用来设计和分析算法，执行常见的AI任务，如图像处理、计算机视觉和动作规划等。

几何学也是国际数学奥林匹克竞赛的重要课题。这个竞赛旨在测验逻辑推理和发现新知识的能力，每年吸引全球各地优秀的高中生，来挑战数学难题。

然而，就算是目前最先进的AI系统，都还难以证明数学猜想（Conjecture）的真伪。AI界普遍认为，能证明数学定理，是发展通用AI（即AGI）的关键一步，但它有个大挑战：训练数据的缺乏。因为，专为AI创建数学证明数据，既困难又昂贵，专家们很难收集到足够的训练数据，来打造AI解题模型。

根据IMO规则生成1亿笔训练数据，最终解出25道题

为解决这个挑战，Google DeepMind研究团队Trieu Trinh和Thang Luong先是根据IMO规则，生成了1亿个不同复杂度的数学定理和证明，并用这些合成的训练数据，从头训练出一套AI系统AlphaGeometry。在这个过程中，完全没使用人工范例。

而在架构上，它是一套神经符号（Neuro-symbolic）系统，采混合式架构，由神经语言模型（NLL）和符号推论引擎（Symbolic deduction engine）2大部分组成。

其中，神经语言模型扮演引导角色，来指导符号推论引擎，如何在IMO等级的问题中，从几何构造的无限可能中找出解决方案（如下图）。这是因为，IMO几何问题以图形呈现，需要添加新的几何结构（如点、线、面）才能解题，而AlphaGeometry的语言模型，可以从无数个可能性中，预测出添加哪些新结构最有用。这些线索，能帮助符号引擎进一步推导图形，找出最接近的解答。

AlphaGeometry如何解决一个简单问题：首先，给定问题图形和定理（左），AlphaGeometry（中）接着用符号引擎，来推导图形的新陈述，直到找到解决方案或新陈述用完为止。若未找到解决方案，AlphaGeometry的语言模型会添加一个可能有用的构造（蓝色部分），给符号引擎新的推导方向。这个循环会一直出现，直到找到解决方案为止（右）。

AlphaGeometry也成功在最新的IMO竞赛中，在规定时间内解出25道题（共30题），能力与世界上最聪明的高中数学生相当，媲美历届金牌的平均成绩25.9道题。

Google认为，这个成功，不只是数学推理上的突破，还能运用到更广泛的科学领域问题。而且，AlphaGeometry解决专家级的复杂数学问题，未来还能帮助人类更理解世界运行的过程。

Google DeepMind新AI媲美国际数学奥林匹克金牌的解题能力

浏览过的版块