zbo智博1919com

新闻中心 新闻中心

菲尔兹奖得主0贡献!GPT-5.5 Pro两小时跑出博士级证明

新智元报道

作者::曹曼茜
颁布功夫::2026-05-13 21:31:51
阅读量::3745

菲尔兹奖得主0贡献!GPT-5.5 Pro两小时跑出博士级证明

新智元报道

编纂::桃子

【新智元导读】全网震撼!菲尔兹奖得主把未解数学题扔给GPT-5.5 Pro,不到两小时拿到博士论文级证明。整个过程中,他没给出任何数学思路。

今天,菲尔兹奖得主Timothy Gowers在小我博客上发了一篇长文——

最近一次使用ChatGPT 5.5 Pro的履历

标题平平无奇,内容却让整个数学圈坐不住了。

文中,他亲手验证了一个令整个数学界不寒而栗的事实::

GPT-5.5 Pro,用了不到两个小时,独立实现了一项博士论文级此外数学钻研。

而Gowers自己在整个过程中,数学贡献险些为0。

两个小时,一章博士论文级成就。

全程2小时,菲尔兹奖得主贡献为0

事件是这样的。

这几天,Timothy Gowers拿到了ChatGPT 5.5 Pro的测试权限,决定搞一次真刀真枪的测试。

他从数学家Melvyn Nathanson的一篇新论文中,挑出了几个关于加法数论中集中求和的未解问题。

这些问题的主题是::给定一个k个整数的集中A,它的h重求和集hA的可能巨细有哪些???

要实现特定巨细的求和集,集中的「直径」最小能是几多???

Nathanson自己给出了一个指数级的上界::2^k - 1。

因而,Gowers把问题扔给了GPT-5.5 Pro。17分钟05秒后,AI给出了一个机关,直接把上界从指数级干到了二次方级。

而这,显然已经是最优的了。

更让人坐不住的,是Gowers在整个过程中表演的角色。

他没有给出任何数学思路,没有提供关键引理,更没有指出证明方向,

Gowers只是充任了一个「感情价值提供者」和「排版助手」,给出的提醒词极其单一——

对,这个设法不错,碰运气能不能成;;

把这段推导写成尺度的LaTeX论文体式。

博客中,Gowers在反复强调::提醒词「不蕴含任何数学输入」。

AI走的每一步推理、每一个机关、每一处关键转折,都是它自己想出来的。

仅用了几个小时,AI就实现了人类可能必要数月,甚至数年能力实现的工作。

换句话说,人类顶级数学家在这场所作中的智力贡献,约等于0。

AI给出原创设法,震惊MIT博士生

若是故事到这里就实现了,那顶多算是「AI又解了一道数学题」。

但后面产生的事件,才真正让人细思极恐。

Gowers持续追问ChatGPT::那通常情况的h呢???这个问题的难度陡然上升。

由于当h=2的时辰,数学家们已齐全搞清了所有可能的求和集巨细。但对于通常的h,甚至不知晓齐全的答案是什么。

此前,MIT博士生Isaac Rajagopal已经证了然一个指数级的上界。

Gowers因而让GPT去看看能不能改进拉Rajagopal的了局。

第一轮::GPT思虑了16分41秒,把上界从k的指数级改进到了k^(1/2+ε)的指数级。

这是对拉Rajagopal工作的「通例批改」。

第二轮::Gowers说,能不能再进一步,搞到多项式级???

GPT思虑了13分33秒,暗示「有戏」,但必要验证两个技术性命题。

Gowers让它自己验证,9分12秒后,GPT实现了验证,并在随后的31分40秒内写出了齐全的预印本论文。

论文地址::https://drive.google.com/file/d/1IkJBcWYz_3J_QGsESBmMa-jrEHAJDcJB/view

最终了局::N(h,k) ≤ O(k^{10h?})——从指数级,直接跃升到多项式级。

Rajagopal自己看完后,给出了一个让人五味杂陈的评价::

ChatGPT这个设法很原创、很奇妙。若是是我自己想出来的,我会极度高慢。

然而,我必要一两周能力实现的脑力风暴,GPT只用了不到一个小时。

更重磅的是,Rajagopal具体分析了GPT的主题创新——

它使用了h?-耗散集(h?-dissociated sets)来节制h阶以下的关系!刚飧鏊悸,据我所知,齐满是原创的」。

不得不说,当一个MIT学生用「我会为这个设法感应高慢」来评价一个AI的数学证明时,某种范式转移已经悄然产生了。

顶级数学家忠告::;;戳

菲尔兹奖得主Gowers没有停顿在「ChatGPT很厉害」的层面,他直接把话题拉到了最敏感的问题::

博士生怎么办???

这才是这篇博客真正的重量级炸弹。

在组合数学领域,有大量论文会提出一系列新的组合参数,并附带一串未解问题。

这些问题通常不是出格难,它们的价值在于给初入科研的学生提供一个「能够攻克的指标」,让他们在解决一个「正式的盛开问题」中获得信心和成就感。

但此刻,这条路被AI截断了。Gowers的原话说得很直白::

从前,只有有人提出问题就够了。

但此刻,仅仅被提出是不够的,它还必须足够难,难到LLM解决不了。

2026年至今,已有15个Erd?s盛开问题被解决,其中11个明确标注了AI的贡献。

就在几周前,一个23岁、没有高档数学学位的年轻人Liam Price,用GPT-5.4 Pro在80分钟内解决了一个困扰数学家60年的Erd?s问题。

菲尔兹奖得主陶哲轩亲自验证了这个证明,并将其扩大为一个新理论的起点。

从前必要数年训练能力达到的钻研能力门槛,正在被AI一夜之间碾平。

Gowers直言,「若是AI在数学领域以目前这个速度发展下去,那么我们将很快面对一场;;。

对此,OpenAI钻研员Sebastien Bubeck深表赞成。

但也有人默默指出::这只是一次尝试,不能过度外推。Nathanson的问题固然是盛开问题,但难度不定代表数学前沿的天花板。

Gowers自己也认可,他「没有齐全答案」,只是在纪录自己的经历。

从前两年,类似的「AI攻克数学」叙事出现过好几次,仔细看城市发现具体前提限度不少。

但这一次,措辞的人是菲尔兹奖得主,他的判断尺度不必要额外背书。

AI数学加快度,已不成逆转

把功夫线拉长一点就会发现,AI在数学领域的进取曲线险些是垂直的。

2023年,GPT-4做不了大无数本科数学题;;2024年,o1在数学较量中拿到了金牌水平;;2025年,o3在前沿钻研中起头展示推理能力。

2026年5月,GPT-5.5 Pro独立实现了博士论文级此外证明。

三年,从本科到博士。

Gowers的尝试揭示了一个临界点::AI不只是工具了。至少在某些问题上,它已经是一个能独立产出原创了局的钻研者。

那些已经必要数年苦修能力叩开的大门,此刻只必要一个提醒框和两个小时。

门槛没了。但门后面的世界,可能比我们设想的更大,也更陌生。

参考资料::

https://x.com/wtgowers/status/2052830948685676605?s=20

https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/

 

文章点评

未查问到任何数据!

颁发评论

◎欢迎参加会商,请在这里颁发您的见解、互换您的概念。

最新文章

热点文章

随机推荐

【网站地图】