首篇「角色扮演AI」綜述!復(fù)旦等提出大模型三層人格分類(lèi)框架:群體、角色、個(gè)性化 | TMLR
原標(biāo)題:首篇「角色扮演AI」綜述!復(fù)旦等提出大模型三層人格分類(lèi)框架:群體、角色、個(gè)性化 | TMLR
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):4463字
角色扮演AI:數(shù)字生命的曙光
近年來(lái),隨著大語(yǔ)言模型(LLMs)的快速發(fā)展,角色扮演AI(RPLAs)這一概念正逐漸從科幻走向現(xiàn)實(shí)。復(fù)旦大學(xué)的研究人員近期發(fā)表的一篇綜述論文,系統(tǒng)梳理了RPLAs的研究現(xiàn)狀,并為未來(lái)研究指明了方向。
1. RPLAs:模擬人類(lèi)角色的AI系統(tǒng)
RPLAs系統(tǒng)能夠模擬指定角色的能力,通過(guò)交互形式將不同角色帶入現(xiàn)實(shí)。這體現(xiàn)了人類(lèi)創(chuàng)造并與智能人工生命互動(dòng)的渴望。論文中,研究人員提出了一種三層人格分類(lèi)框架,將RPLAs的人格類(lèi)型分為群體人格、角色人格和個(gè)性化人格,這三類(lèi)人格并非相互,可以在一個(gè)RPLA系統(tǒng)存。
2. RPLAs的三層人格分類(lèi)框架
① 群體人格:基于LLMs中關(guān)于特定群體(如職業(yè)、種族)的統(tǒng)計(jì)特征,通過(guò)簡(jiǎn)單的提示詞即可激活;② 角色人格:代表廣為人知的具體個(gè)體,如名人、歷史人物和虛構(gòu)角色,需要模型理解和運(yùn)用已有角色數(shù)據(jù);③ 個(gè)性化人格:基于個(gè)性化用戶數(shù)據(jù)構(gòu)建,強(qiáng)調(diào)個(gè)人獨(dú)特的經(jīng)歷、需求和偏好,主要用于數(shù)字分身或個(gè)人助理等應(yīng)用。
3. RPLAs的構(gòu)建方法
RPLAs的構(gòu)建主要依賴兩種方法:參數(shù)化訓(xùn)練和非參數(shù)化提示。參數(shù)化訓(xùn)練包括預(yù)訓(xùn)練、監(jiān)督微調(diào)和強(qiáng)化學(xué)習(xí)三個(gè)階段,旨在提升模型的角色扮演能力和特定角色知識(shí)。非參數(shù)化提示則在上下文中提供人格數(shù)據(jù)和角色扮演指令,這些數(shù)據(jù)可以通過(guò)在線資源收集、自動(dòng)提取、對(duì)話合成和人工標(biāo)注等方式獲取。現(xiàn)代RPLAs通常還會(huì)集成記憶模塊,以提升交互體驗(yàn)。
4. RPLAs的評(píng)估體系
RPLAs的評(píng)估主要分為兩類(lèi):角色扮演能力評(píng)估和人格還原度評(píng)估。前者關(guān)注擬人能力、吸引力和實(shí)用性等方面;后者則關(guān)注特定人格的RPLA是否很好地復(fù)制了目標(biāo)人格的特點(diǎn)。目前主要的評(píng)估方法包括基于標(biāo)準(zhǔn)答案的自動(dòng)評(píng)估、無(wú)標(biāo)準(zhǔn)答案的自動(dòng)評(píng)估、多選題評(píng)估和人工評(píng)估,但每種方法都存在一定的局限性,對(duì)RPLAs的精準(zhǔn)評(píng)估仍是一個(gè)開(kāi)放性問(wèn)題。
5. RPLAs面臨的挑戰(zhàn)與未來(lái)展望
盡管RPLAs展現(xiàn)出令人振奮的發(fā)展前景,但仍面臨諸多挑戰(zhàn),例如構(gòu)建更全面的角色數(shù)據(jù)集、實(shí)現(xiàn)更精準(zhǔn)的評(píng)估方法、平衡真實(shí)性與安全性以及處理持續(xù)交互中的角色演變等。隨著技術(shù)的進(jìn)步,培育人類(lèi)與智能體協(xié)同共存的社會(huì)生態(tài)將成為重要方向,這將改變?nèi)藱C(jī)交互的方式,并推動(dòng)數(shù)字生命這一人類(lèi)長(zhǎng)期追求的實(shí)現(xiàn)。
總而言之,這篇綜述論文為RPLAs的研究提供了寶貴的參考,也為未來(lái)研究指明了方向,相信隨著技術(shù)的不斷進(jìn)步,RPLAs將在更多領(lǐng)域發(fā)揮作用,為人們帶來(lái)更加智能、個(gè)性化的互動(dòng)體驗(yàn)。
聯(lián)系作者
文章來(lái)源:新智元
作者微信:
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類(lèi)社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。