新用户登入 登录

萌子岛

  • 2
  • 0

Google DeepMind新AI媲美国际数学奥林匹克金牌的解题能力

1023粉丝
darthracer Elysion~楽的次元2024-2-9 12:41 显示全部楼层 |阅读模式
<
1.jpg

Google DeepMind最近发布一款AI系统AlphaGeometry,使用1亿笔合成数据训练,就能在最新的30道国际数学奥林匹克(IMO)题目中,在规定时间内解出25道题。它不只比先前只解出10题的最佳AI还厉害,表现还接近人类金牌得主的平均值25.9道题,是迈向通用AI的一大里程碑。这项研究成果,日前也登上《Nature》期刊。

最先进的AI系统解几何学难题,仍是个挑战

为何AI解几何学题目很重要?

因为,几何学是数学最古老、最基础的分支之一,也是计算机科学、建筑、艺术、工程、天文等领域的重要工具。就计算机科学来说,几何学因涉及空间属性,例如距离、形状、大小和相对位置等,是重要的处理工具,尤其能用来设计和分析算法,执行常见的AI任务,如图像处理、计算机视觉和动作规划等。

几何学也是国际数学奥林匹克竞赛的重要课题。这个竞赛旨在测验逻辑推理和发现新知识的能力,每年吸引全球各地优秀的高中生,来挑战数学难题。

然而,就算是目前最先进的AI系统,都还难以证明数学猜想(Conjecture)的真伪。AI界普遍认为,能证明数学定理,是发展通用AI(即AGI)的关键一步,但它有个大挑战:训练数据的缺乏。因为,专为AI创建数学证明数据,既困难又昂贵,专家们很难收集到足够的训练数据,来打造AI解题模型。

根据IMO规则生成1亿笔训练数据,最终解出25道题

为解决这个挑战,Google DeepMind研究团队Trieu Trinh和Thang Luong先是根据IMO规则,生成了1亿个不同复杂度的数学定理和证明,并用这些合成的训练数据,从头训练出一套AI系统AlphaGeometry。在这个过程中,完全没使用人工范例。

而在架构上,它是一套神经符号(Neuro-symbolic)系统,采混合式架构,由神经语言模型(NLL)和符号推论引擎(Symbolic deduction engine)2大部分组成。

其中,神经语言模型扮演引导角色,来指导符号推论引擎,如何在IMO等级的问题中,从几何构造的无限可能中找出解决方案(如下图)。这是因为,IMO几何问题以图形呈现,需要添加新的几何结构(如点、线、面)才能解题,而AlphaGeometry的语言模型,可以从无数个可能性中,预测出添加哪些新结构最有用。这些线索,能帮助符号引擎进一步推导图形,找出最接近的解答。

2.jpg

AlphaGeometry如何解决一个简单问题:首先,给定问题图形和定理(左),AlphaGeometry(中)接着用符号引擎,来推导图形的新陈述,直到找到解决方案或新陈述用完为止。若未找到解决方案,AlphaGeometry的语言模型会添加一个可能有用的构造(蓝色部分),给符号引擎新的推导方向。这个循环会一直出现,直到找到解决方案为止(右)。

AlphaGeometry也成功在最新的IMO竞赛中,在规定时间内解出25道题(共30题),能力与世界上最聪明的高中数学生相当,媲美历届金牌的平均成绩25.9道题。

Google认为,这个成功,不只是数学推理上的突破,还能运用到更广泛的科学领域问题。而且,AlphaGeometry解决专家级的复杂数学问题,未来还能帮助人类更理解世界运行的过程。
您需要登录后才可以回帖 登录 | 新用户登入

小黑屋|萌子岛

GMT+8, 2025-1-31 16:49 , Processed in 0.568506 second(s), 30 queries , Gzip On, MemCache On.

Copyright 2020  atollmoe©.a2.1.0 All rights reserved. 9+

Copyright 2009  supported by zhixuan© oeo© oko© All rights reserved.Thank you!

快速回复 返回顶部 返回列表