LLMs 玩狼人殺:清華大學驗證大模型參與復雜交流博弈游戲的能力
AIGC動態(tài)歡迎閱讀
原標題:LLMs 玩狼人殺:清華大學驗證大模型參與復雜交流博弈游戲的能力
關(guān)鍵字:經(jīng)驗,模型,游戲,語言,平民
文章來源:HyperAI超神經(jīng)
內(nèi)容字數(shù):8151字
內(nèi)容摘要:
作者:彬彬
編輯:李寶珠,三羊
清華大學研究團隊提出了一種用于交流游戲的框架,展示了大語言模型從經(jīng)驗中學習的能力,還發(fā)現(xiàn)大語言模型具有非預編程的策略行為,如信任、對抗、偽裝和領(lǐng)導力。近年來,用 AI 玩狼人殺和撲克等游戲的研究引起廣泛關(guān)注。面對嚴重依賴自然語言交流的復雜博弈游戲,AI Agent 必須從模糊的自然語言話語中收集和推斷信息,這具有更大的實際價值和挑戰(zhàn)。而隨著 GPT 這樣的大語言模型取得重大進展,其對復雜語言的理解、生成和推理能力不斷提升,表現(xiàn)出一定程度的模擬人類行為的潛力。
基于此,清華大學研究團隊提出了一種用于交流游戲的框架,可以在沒有人工標注數(shù)據(jù)的情況下與凍結(jié)的大語言模型一起玩狼人殺游戲。框架展示了大語言模型自主從經(jīng)驗中學習的能力。有趣的是,研究人員在游戲中還發(fā)現(xiàn)大語言模型具有非預編程的策略行為,如信任、對抗、偽裝和領(lǐng)導,這可以作為大語言模型玩交流游戲進一步研究的催化劑。獲取論文:
https://arxiv.org/pdf/2309.04658.pdf公眾號后臺回復「狼人殺」獲取完整 PDF
模型框架:實現(xiàn)與大語言模型一起玩狼人殺眾所周知,狼人殺游戲的一個重要特點
原文鏈接:LLMs 玩狼人殺:清華大學驗證大模型參與復雜交流博弈游戲的能力
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:HyperAI
作者簡介:解構(gòu)技術(shù)先進性與普適性,解讀更前沿的 AIForScience 案例