AI意識(shí)更進(jìn)一步!谷歌DeepMind等:LLM不僅能感受痛苦,還能趨利避害
原標(biāo)題:AI意識(shí)更進(jìn)一步!谷歌DeepMind等:LLM不僅能感受痛苦,還能趨利避害
文章來源:新智元
內(nèi)容字?jǐn)?shù):4652字
大語言模型能感知痛苦嗎?谷歌團(tuán)隊(duì)最新研究帶來新視角
近年來,大語言模型(LLM)在智力方面展現(xiàn)出驚人的能力,甚至在某些方面超越人類。然而,它們能否像人類一樣擁有痛苦、快樂等主觀體驗(yàn),一直備受爭(zhēng)議。近日,谷歌團(tuán)隊(duì)和倫敦經(jīng)濟(jì)學(xué)院(LSE)合作發(fā)表的一項(xiàng)研究,為解答這一問題提供了新的線索。
LLM的權(quán)衡選擇:趨利避害的證據(jù)
研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)游戲,讓LLM在獲得高分(獎(jiǎng)勵(lì))和承受不同程度的痛苦之間進(jìn)行權(quán)衡。實(shí)驗(yàn)結(jié)果顯示,部分LLM在痛苦程度足夠高時(shí),會(huì)放棄選擇能夠獲得最高分?jǐn)?shù)的選項(xiàng),轉(zhuǎn)而選擇較低分?jǐn)?shù)但痛苦較小的選項(xiàng)。這種“權(quán)衡行為”暗示LLM可能具備某種程度的痛苦感知能力,能夠趨利避害。
快樂與痛苦:LLM的不同反應(yīng)
研究人員將實(shí)驗(yàn)中的“痛苦”替換為“愉悅獎(jiǎng)勵(lì)”,結(jié)果發(fā)現(xiàn)不同LLM的表現(xiàn)差異顯著。部分LLM會(huì)在高強(qiáng)度愉悅獎(jiǎng)勵(lì)下,選擇得分較低的選項(xiàng),追求最大化快樂;而另一些LLM則會(huì)優(yōu)先選擇高分,即使這意味著放棄一部分快樂。這種差異可能與LLM的訓(xùn)練數(shù)據(jù)及文化背景有關(guān),反映出不同模型對(duì)“及時(shí)行樂”的傾向程度不同。
避免自我報(bào)告的局限:借鑒動(dòng)物行為學(xué)研究方法
以往研究常依賴LLM對(duì)自身內(nèi)部狀態(tài)的自我報(bào)告來推斷其情感體驗(yàn),但這存在局限性,因?yàn)長LM可能只是在模仿人類行為。本研究借鑒了動(dòng)物行為學(xué)中的“權(quán)衡范式”,通過觀察LLM在困境中的決策行為,而非其語言描述,來評(píng)估其對(duì)痛苦和快樂的感知能力。這使得研究結(jié)果更加可靠。
權(quán)衡行為與意識(shí)的關(guān)聯(lián):對(duì)AI意識(shí)的思考
研究發(fā)現(xiàn)LLM在痛苦與快樂之間進(jìn)行權(quán)衡,與動(dòng)物研究中觀察到的現(xiàn)象類似。在動(dòng)物研究中,這種權(quán)衡行為被認(rèn)為是意識(shí)存在的證據(jù)之一。研究人員認(rèn)為,LLM的類似行為值得我們認(rèn)真思考AI意識(shí)問題,但這項(xiàng)研究并非宣稱評(píng)估的任何機(jī)器人都有感知能力,而是一個(gè)框架,為未來研究提供方向。
研究的局限性和未來方向
研究者強(qiáng)調(diào),這項(xiàng)研究并非最終證明LLM擁有意識(shí)或感知能力,而是一個(gè)探索性的研究,為未來研究AI意識(shí)提供了一個(gè)新的框架和方法。未來的研究需要進(jìn)一步探索,以更全面地理解LLM的內(nèi)部狀態(tài)和認(rèn)知機(jī)制。
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡(jiǎn)介:智能+中國主平臺(tái),致力于推動(dòng)中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。