AI 推理能力之爭：蘋果結論遭專家挑戰

IT之家 6 月 14 日消息，科技媒體 9to5Mac 昨日（6 月 13 日）發布博文，報道稱蘋果公司 6 月 6 日發布的 AI 研究論文《The Illusion of Thinking》引發爭議，專家質疑評估方法。

蘋果公司在論文中指出，即便是當前最先進的大型推理模型（LRMs），在復雜任務中也會崩潰。不過 Open Philanthropy 的研究員 Alex Lawsen 對此提出詳細反駁，認為蘋果的結論源于實驗設計缺陷，而非模型推理能力的根本性局限。

爭議的焦點是蘋果論文指出，即便是當前最先進的大型推理模型，在處理漢諾塔問題（Tower of Hanoi）等復雜任務時，也會出現徹底失敗的情況。

AI 推理能力之爭：蘋果結論遭專家挑戰

IT之家注：漢諾塔問題是一個經典的遞歸算法問題：上帝創造了三根柱子，并在第一根柱子上按順序套有 N 個大小不同的圓盤（自下而上，圓盤由大到小，呈金字形）。

規定每次只能移動最頂端的一個圓盤，并且保證整個過程中大圓盤不能放在小圓盤之上。欲將所有圓盤從第一根柱子移動到第三根柱子，試給出解決方案。

Open Philanthropy 的研究員 Alex Lawsen 近日發布反駁文章《The Illusion of the Illusion of Thinking》，認為蘋果的研究結果更多反映了實驗設計的缺陷，而非模型推理能力的真正局限。他在文章中直言，蘋果的研究混淆了輸出限制和評估設置問題，與實際推理失敗無關。

AI 推理能力之爭：蘋果結論遭專家挑戰