这个周末 AI 圈非常热闹,OpenAI 陷入舆论中心,Google、Meta 和 AI 圈多位大佬加入混战。
一句话概括就是:OpenAI 研究员宣称 GPT-5 「发现」了 10 个悬赏数学难题的解决方法,舆论误以为是 GPT-5 给出了解题方法,结果被发现只是检索到了早已存在的文献,引发了学界大佬的群嘲和对于 AI 夸大宣传的激烈讨论。
故事要从几条引爆社交平台的推文说起。
GPT-5 解决悬赏难题?
10 月 12 日,Sebastien Bubeck 发推表示 GPT-5 文献搜索方面超凡脱俗,发现了 Erdős 问题 339 已被解决但在官方数据库中状态尚未修改。
10 月 17 日,OpenAI 研究人员 Mark Sellke 转发此贴更新,表示他和 Mehtaab 使用 GPT-5 模型进一步研究,通过数千次查询,针对 erdosproblems.com 网站上列为「开放」的 Erdős 问题进行了调查。
他们声称「发现了」10 个问题的解决方案(问题编号:223、339、494、515、621、822、883(第 2/2 部分)、903、1043、1079)。同时他们在另外 11 个问题上也取得了部分进展。
OpenAI 首席产品官 Kevin Weil 转发此贴。
这些问题源自数学家 Paul Erdős 提出的未解决问题列表,该网站由数学家 Thomas Bloom 维护。
OpenAI 的副总裁 Sebastien Bubeck 转发并宣称「AI 加速科学已正式开始」,并顺势宣布 Mark Sellke 加入 OpenAI。
一时间,公众和媒体普遍认为 GPT-5 在数学推理能力上取得了惊人突破,能够独立解决困扰人类数学家数十年的难题。
反转:「这很尴尬」
然而,这场狂欢仅仅持续了几个小时,就迎来了反转。
谷歌 DeepMind 的 CEO Demis Hassabis 在 Sebastien Bubeck 那条「AI 加速科学」的推文下回复:这很尴尬。
Hassabis 随后引导公众关注该数学难题网站维护者、数学家 Thomas Bloom 的澄清。
Thomas Bloom 表示:OpenAI 的表述为「戏剧性的误解」。网站上将这些问题标记为「未解决」,仅仅代表他个人不知道相关解答已经发表,并不意味着数学界没有人解决。
换言之,GPT-5 扮演了一个效率极高的学术搜索引擎,而非一个数学家。
Sebastien Bubeck 随后删除帖子并道歉,称「我无意误导任何人,我认为表述很清楚,对不起」。他强调,AI 在文献搜索上的作用非常有价值,因为「搜索文献有多难,我很清楚」,这能加速科学研究。
Kevin Weil 也删帖并承认「我实际上误解了我们的结果(尴尬)」。Mark Sellke 的更新也是转发此贴。
Hoisted by their own GPTards
对此,Lecun 也辛辣点评:(OpenAI)被自己吹捧 GPT 的言论坑惨了(Hoisted by their own GPTards),讽刺其作茧自缚。
注:源自莎士比亚戏剧《哈姆雷特》的著名短语 Hoist with his own petard(被自己的炸药包给炸飞了),这里 petard(炸药)改成了 GPTards(-tards 源自英文单词 retard,意为笨蛋),指代那些盲目崇拜 ChatGPT / AI 的人。
搞笑的是,就在同一天,Lecun 在一篇指出最近的热门论文《Definition of AGI》中存在虚假引用的帖子下面回复了相同的一句话。
Gary Marcus 也做出点评:任何期望当前范式接近AGI的人都是在痴心妄想。
网友也进行了激烈讨论,有部分人认为 OpenAI 再一次炒作失败。
不过也有人认为,这是一个有价值的事情。
陶哲轩的观点与此类似,他在 Mastodon 上表示,AI 在数学中的即时潜力在于加速文献搜索等琐碎任务,而非解决最难的开放问题。他承认 AI 可能「工业化」数学,加速整体进展,但强调人类专家仍需审查、分类和整合 AI 结果。
贴文地址: https://mathstodon.xyz/@tao/115385022005130505
还有人对「炒作」行为做出了更深层次的解读。
无论如何,这件事再次警醒我们,在追求技术突破的道路上,AI 社区究竟该如何平衡严谨的科学精神与必要的公众宣传?
参考链接:
https://x.com/Yuchenj_UW/status/1979422127905476778
https://x.com/ns123abc/status/1979574373435441229
https://x.com/ylecun/status/1979596956277289353