趕緊放棄強(qiáng)化學(xué)習(xí)?!Meta 首席 AI 科學(xué)家楊立昆喊話:當(dāng)前推理方式會(huì)“作弊”,卷大模型沒(méi)有意義!
與其讓模型變得更大,不如讓它們更聰明。

原標(biāo)題:趕緊放棄強(qiáng)化學(xué)習(xí)?!Meta 首席 AI 科學(xué)家楊立昆喊話:當(dāng)前推理方式會(huì)“作弊”,卷大模型沒(méi)有意義!
文章來(lái)源:AI前線
內(nèi)容字?jǐn)?shù):21113字
Yann LeCun 論 AI 的未來(lái):超越大語(yǔ)言模型的暴力計(jì)算
Meta 首席 AI 科學(xué)家 Yann LeCun 近日在 AI Action Summit 2025 上發(fā)表演講,指出當(dāng)前基于深度學(xué)習(xí)的大語(yǔ)言模型(LLM)存在根本性缺陷,并提出了構(gòu)建真正“會(huì)思考”的 AI 模型的新方向。
1. 現(xiàn)有 AI 的局限性:莫拉維克悖論與“幻覺(jué)”
LeCun 認(rèn)為,現(xiàn)有 AI 系統(tǒng),例如 GPT 模型,通過(guò)自回歸方式逐個(gè)生成 token,依賴預(yù)測(cè)器重復(fù)操作,導(dǎo)致其具有發(fā)散性,容易出現(xiàn)“幻覺(jué)”。 這種基于預(yù)測(cè)下一個(gè)詞元的模式,即使在擁有海量數(shù)據(jù)的情況下,也無(wú)法重現(xiàn)人類或動(dòng)物的常識(shí)和對(duì)物理世界的理解。他用“莫拉維克悖論”解釋了這一現(xiàn)象:AI 在復(fù)雜任務(wù)(如語(yǔ)言生成)上表現(xiàn)出色,但在簡(jiǎn)單任務(wù)(如收拾餐桌)上卻力不從心。 這表明,單純依靠文本數(shù)據(jù)無(wú)法達(dá)到人類智能水平,高級(jí) AI 需要對(duì)世界有更深層次的理解。
2. 高級(jí)機(jī)器智能(AMI)的要素
LeCun 提出“高級(jí)機(jī)器智能”(AMI)的概念,而非“通用人工智能”(AGI)。AMI 應(yīng)具備以下特征:從感官輸入中學(xué)習(xí)、具有持久記憶、能夠規(guī)劃和推理、可控且安全。 他強(qiáng)調(diào),安全性的實(shí)現(xiàn)不應(yīng)依賴于微調(diào),而應(yīng)在系統(tǒng)設(shè)計(jì)中固化。
3. 基于世界模型的推理:從預(yù)測(cè)到規(guī)劃
LeCun 認(rèn)為,改變 AI 的推理方式是關(guān)鍵。他提出了基于“能量函數(shù)”的推理模式,這與經(jīng)典 AI 和概率圖模型的思路相近,更接近人類的“系統(tǒng)二”思維(理智思考)。 這種模式下,系統(tǒng)通過(guò)尋找最小化能量函數(shù)的輸出值來(lái)進(jìn)行推理,復(fù)雜問(wèn)題會(huì)花費(fèi)更多時(shí)間,簡(jiǎn)單問(wèn)題則更快。 這與當(dāng)前 LLM 的“系統(tǒng)一”思維(直覺(jué)反應(yīng))截然不同。
他進(jìn)一步介紹了“世界模型”的概念,即系統(tǒng)在抽象表示空間中,根據(jù)當(dāng)前狀態(tài)和動(dòng)作序列預(yù)測(cè)未來(lái)狀態(tài)。 這使得 AI 能夠進(jìn)行層次化規(guī)劃,從宏觀目標(biāo)分解到具體的動(dòng)作,類似于人類的思考和行動(dòng)過(guò)程。 目前,AI 系統(tǒng)缺乏這種自主學(xué)習(xí)層次化表示和規(guī)劃的能力。
4. JEPA 架構(gòu):超越生成模型
LeCun 批判了生成式模型在視頻生成上的局限性,并提出了“聯(lián)合嵌入預(yù)測(cè)架構(gòu)”(JEPA)。 JEPA 不直接預(yù)測(cè)像素,而是預(yù)測(cè)內(nèi)容的抽象表示,從而避免了對(duì)無(wú)法預(yù)測(cè)因素的處理,簡(jiǎn)化了預(yù)測(cè)過(guò)程。 他特別強(qiáng)調(diào)了基于動(dòng)作條件的 JEPA 變體,它可以作為世界模型,用于規(guī)劃和決策。
5. 訓(xùn)練 JEPA:放棄對(duì)比方法,轉(zhuǎn)向正則化
LeCun 指出,訓(xùn)練 JEPA 需要新的方法,他建議放棄對(duì)比方法,轉(zhuǎn)向正則化方法,以最小化低能量空間的體積。 他介紹了幾種正則化方法,包括基于信息內(nèi)容的正則化和蒸餾方法,并分析了這些方法的優(yōu)缺點(diǎn)和適用場(chǎng)景。
6. V-JEPA 和基于 Dino 的世界模型:實(shí)際應(yīng)用
LeCun 展示了 V-JEPA 在視頻處理中的應(yīng)用,以及基于 Dino 特征的世界模型在機(jī)器人規(guī)劃中的應(yīng)用。 這些例子展示了 JEPA 架構(gòu)在學(xué)習(xí)常識(shí)、進(jìn)行規(guī)劃和控制方面的潛力。
7. AI 的未來(lái):開(kāi)源與協(xié)作
LeCun 呼吁放棄對(duì)生成模型、概率模型、對(duì)比方法和強(qiáng)化學(xué)習(xí)的過(guò)度依賴,轉(zhuǎn)向基于能量函數(shù)和世界模型的新的 AI 架構(gòu)。 他強(qiáng)調(diào)開(kāi)源 AI 平臺(tái)的重要性,認(rèn)為只有通過(guò)全球范圍內(nèi)的協(xié)作,才能構(gòu)建真正普惠且安全的 AI 系統(tǒng)。
聯(lián)系作者
文章來(lái)源:AI前線
作者微信:
作者簡(jiǎn)介:面向AI愛(ài)好者、開(kāi)發(fā)者和科學(xué)家,提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實(shí)踐案例,助你全面擁抱AIGC。

粵公網(wǎng)安備 44011502001135號(hào)