
张佳欣
从计算机科学、医学直至国家安全部门,数学扮演着一个至关重要的角色,并且在这些领域中都能体现出其强大的作用,但它的发展仍需数年的时间方可实现。
在过去的几百个世纪里,数学家一直依靠简单的工具进行工作:一张纸、一支笔。这些简单而直观的方法激发他们的灵感,并用符号将复杂的数学概念串联起来,直至最终找到真理的方向。
为了打破这种局面,美国国防部高级研究项目管理局今年四月份启动了名为“指数级数学”的计划,并旨在研发一种可以极大提高数学研究效率的人工智能“合著者”。
几十年来,数学家使用计算机帮助他们进行计算或验证命题,现在的人工智能或许可以走得更远一些,挑战那些人类长久未破解的难题。不过,从能解答高中难题的人工智能到能够协助攻克前沿数学难关的人工智能,中间仍有巨大的鸿沟等待跨越。
不但需要“套路”。
大型语言模型(LLM)不擅长处理复杂的数理逻辑问题,它们常常会因缺乏数学知识而做出错误推断。然而,新一代的大型推理系统如OpenAI的o3和Anthropic的Claude 4 Thinking等,在这方面已取得长足的进步,让许多数学专家刮目相看。
今年,在美国数学挑战中,这些模型的表现相当接近优秀高中的成绩。与过去简单粗暴的答案导向不同的是,如今的模型开始展现出在数学领域里类似科学家从理论上探索和解答问题的过程。
此外,一些将法律专业学位(LLM)学习和事实核查任务相结合的独特混合模型取得了令人瞩目的进展。例如,谷歌“深度思维”公司开发的AlphaProof系统将语言模型与围棋人工智能算法——AlphaZero相结合,这一模型实现了在国际数学奥林匹克竞赛上获得银牌级别的成绩,并首次展示了它能在处理长期未解的复杂数学问题时给出优于人类现有解决方案的能力。
麻省理工科技评论认为,尽管这些人工智能表现出色,在科学领域中发挥了重要作用,但该评论认为专家普遍认为它们不具备真正帮助科研的能力,私家侦探,侦探公司,调查公司,查人找物,商务调查,出轨外遇调查,婚外情调查,私人调查,19209219596并且竞赛题目虽具有挑战性,更像是智力游戏,与真正的数学研究存在明显区别。面对“P vs NP”和黎曼猜想等重大难题,AI依然力有未逮,无法发挥作用。
为了更加精准地对人工智能的技能进行评估,前一年,在线学习平台 EpochAI 发布了 Frontiers in Math 测试,并邀请60多位数学专家设计了一系列全新且极具难度的题目。这些题目的复杂性甚至超过了任何一台深度学习模型都能理解和解决的问题。然而,即使最强大的语言模型在面对这些问题时也几乎“全军覆没”。
这些评估显示人工智能虽然已经迈出了一大步,在数 学领域,它仍距成为真正意义上的作者尚有长路可 行。
需要解决的是"过长的推理链条"问题。
细心研读数学难题时能够发观,它们在某些方面颇为相似;解决这类题目的关键,在于找出一系列逻辑步骤的过程。
在加州理工学院工作的谢尔盖·古科夫表示,路径的长度通常可以体现出难题的难易程度。高中数学可能只需要几步就能解答,但对像黎曼猜想这类难题而言,要完成它则需要数以百计甚至千万步。
这类 “超长路径” 极为难以处理。 超过一个简单围棋回合所代表的数量级,它们在人工智能搜索过程中不断攀升,以至于寻找其中正确路径所需的计算量简直令人望而生畏。 在数学中,这一复杂度远远高于棋类游戏所能达到的水平。
物理学家组织网2月报道,为了应对这一挑战,古科夫团队开发了一种方法,将多个步骤打包成“超级步骤”,相当于穿上巨人靴跨过大段路程。他们设计了一个系统,其中强化学习模型提出超级步骤,另一个模型负责验证其合理性。
这一策略成功在经典未解难题——安德鲁斯-柯蒂斯猜想上取得了突破。虽然尚未确定该猜想是正确的还是错误的,借助私家侦探,侦探公司,调查公司,查人找物,商务调查,出轨外遇调查,婚外情调查,私人调查,19209219596人工智能,科学家们找到了一个40年前被广泛引用的“反例”,这曾被认为是证明该猜想错误的关键依据
牛津大学数学家马丁·布里森也认为这是科学研究中一个有价值的过程。
古科夫认为这种“简化路径”的理论能够适用于所有的复杂逻辑链路领域。他的目标是使用这种方法引导人工智能去突破固定思维,并且也能给数理探索带来更多新的灵感。
能否提供真正有价值的洞察?
打破固有的思想定势正是数学者突破难题的关键所在。通常人们将数学理解为一套简单的逻辑推演过程,但真正的高深数学远不止于此,更像是一个充满跌宕起伏、试验错误和闪现灵感的过程。
这就是为什么像 AlphaEvolve 这样的 AI 工具具有如此大的优势:它通过不断生成并优化解题代码来执行 LLM 模型的任务,同时依赖第二个模型评估每次结果,最终提出比人类更加优秀的答案。这种技术不仅可以让机器自主探索,也允许人们随时介入,并为解决难题提供灵感和指导。
澳大利亚悉尼大学一位名叫乔迪·威廉姆森的数学家认为探索性思维是数学的核心。据英国科技杂志《新科学家》网站报道,他与Meta公司合作开发了PatternBoost人工智能系统,该系统可以生成类似于一个数学想法的概念,以激发灵感和创造力。他说:“这就像是有堆有趣的东西,我不知道是怎么回事,但你能再生成一些类似的东西吗?”
这种思维风暴在数学领域中至关重要,它是产生新思想的重要源泉。比如二十面体,古希腊人纯粹推理发现了它,其形状并非大自然的产物,但却深远地影响了数理学的发展进程。威廉姆森期望AI将来也能帮助发现类似的“新数学对象”。
不过目前人工智能仍缺乏真正的创造力。如果让AI去下棋,它做得还挺好;如果它要开发出一盘新围棋游戏,那又是一回事了。像AlphaEvolve和PatternBoost这样的工具也许可以作为人类直觉的侦察兵,帮助人们发现路径并避开死胡同,不过专家普遍认为,真正的创新与突破仍属于人类范畴。
顶: 7459踩: 442



评论专区