首页 >正文

OpenAI研究人员夸大GPT-5数学能力,遭杨立昆等业界人士批评

2025-10-19 08:25:06来源:IT之家


(资料图片仅供参考)

IT之家 10 月 19 日消息,近日,OpenAI 研究人员在社交媒体平台 X 上宣称取得了一项重大数学突破,但很快在学界批评声中撤回了这一说法。批评者包括 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis),他指出该团队的沟通方式“过于草率”。

事件起源于 OpenAI 管理层成员凯文・韦尔(Kevin Weil)发布的一条现已删除的推文。他在文中声称,GPT-5 已“找到了 10 个(!)此前未解的埃尔德什(Erdős)问题的解决方案”,并在另外 11 个问题上取得了进展。他形容这些问题“数十年来一直悬而未决”。其他 OpenAI 研究人员也附和了这一说法。

这些措辞给人的印象是:GPT-5 独立生成了数论领域若干难题的数学证明 —— 这将是一项潜在的重大科学突破,也标志着生成式人工智能有能力发现未知解,推动原创性研究,并开启科技发展的新篇章。

然而,运营网站 erdosproblems.com 的数学家托马斯・布鲁姆(Thomas Bloom)立即提出异议。他称这一说法是“严重的误解”,并澄清道:其网站上的“开放问题”仅表示他自己尚不了解答案,并不意味着这些问题在学术界真正未被解决。事实上,GPT-5 只是检索到了布鲁姆此前未曾注意到的已有研究成果。

DeepMind CEO 德米斯・哈萨比斯将此次事件称为“令人尴尬的”,Meta AI 负责人杨立昆(Yann LeCun)则讽刺 OpenAI“被自己的炒作所反噬”(hoisted by their own GPTards)。

IT之家注意到,相关原始推文随后大多被删除,研究人员也承认了错误。尽管如此,这一事件进一步加剧了外界对 OpenAI 作为一家机构正面临巨大压力且行事不够严谨的看法。人们不禁质疑:在一个本就充满炒作、涉及数十亿美元利益的领域中,为何顶尖 AI 研究人员会未经核实便发布如此惊人的声明?事实上,即便像 Bubeck 这样了解 GPT-5 真实贡献的研究者,仍使用了“找到解决方案”这种具有误导性的模糊表述。

被忽视的真正重点在于:GPT-5 在此过程中展现的实际价值,是作为一种高效的研究工具,用于追踪和整合相关的学术论文。这对于文献分散或术语不统一的研究问题尤其有价值。

著名数学家陶哲轩(Terence Tao)认为,这才是人工智能在数学领域最直接的应用潜力所在 —— 并非攻克最难的开放性问题,而是加速诸如文献检索等繁琐工作。他表示,虽然 AI 在个别复杂问题上已有“零星进展”,但目前最主要的作用仍是节省时间的辅助工具。他还指出,生成式 AI 有望帮助“工业化”数学研究进程,从而加快整个领域的进步步伐。不过,他也强调,人类专家在审查、分类以及安全地将 AI 生成结果融入正式研究方面,仍然发挥着不可替代的关键作用。

标签: 数学 韦尔 杨立昆 人工智能 openai deepmind

观察

4月1日起 三晋景区执行旺季价

原标题:票价稳福利加服务升4月1日起三晋景区执行旺季价4月1日起,山西多家核心景区将执行旺季门票价格。云冈石窟、雁门关、王家大院等景区票价均与往年持平,延续了近年来稳定的定价策略。与此同时,太行山大峡谷面向“山河四省”游客推出免票惠民举措,悬空寺在完成危岩治理后将于4月初恢复开放,各大景区服务配套同步升级,三晋春日文旅市场热度持续升温。春风拂过黄土高原,三晋大地褪去冬日沉寂,古建披新绿、山河绽繁花
2026-04-01

山西省财政打出贴息政策“组合拳”

原标题:我省财政打出贴息政策“组合拳”覆盖个人消费、服务业经营主体、中小微企业三大领域3月31日,记者从省财政厅获悉:我省继续发布三大财政贴息政策“组合拳”,覆盖个人消费、服务业经营主体、中小微企业三大关键领域,以精准有力的财政工具激发市场活力、提振发展信心。政策实施期为2026年1月1日至12月31日,后续将视成效动态优化延续。1 惠民直达个人消费贷款“省心又省钱”居民个人使用贷款经办银行发放的
2026-04-01

山西省全面推广电子劳动合同

3月30日,省人社厅传来消息,《关于加快推广应用电子劳动合同的通知》印发,明确将加快全省电子劳动合同推广应用,依法订立的电子劳动合同与书面劳动合同法律效力等同,用人单位和劳动者可通过官方平台免费办理相关业务,助力优化营商环境、提升用工管理效率。推行电子劳动合同,是优化营商环境的创新举措,是深化数字人社改革的重要内容。为用人单位和劳动者提供便捷服务,有利于维护劳动者和企业双方的合法权益,营造便民利企
2026-04-01