首篇「角色扮演AI」綜述！復旦等提出大模型三層人格分類框架：群體、角色、個性化 | TMLR

原標題：首篇「角色扮演AI」綜述！復旦等提出大模型三層人格分類框架：群體、角色、個性化 | TMLR
文章來源：新智元
內容字數：4463字

角色扮演AI：數字生命的曙光

近年來，隨著大語言模型（LLMs）的快速發展，角色扮演AI（RPLAs）這一概念正逐漸從科幻走向現實。復旦大學的研究人員近期發表的一篇綜述論文，系統梳理了RPLAs的研究現狀，并為未來研究指明了方向。

1. RPLAs：模擬人類角色的AI系統

RPLAs系統能夠模擬指定角色的能力，通過交互形式將不同角色帶入現實。這體現了人類創造并與智能人工生命互動的渴望。論文中，研究人員提出了一種三層人格分類框架，將RPLAs的人格類型分為群體人格、角色人格和個性化人格，這三類人格并非相互，可以在一個RPLA系統存。

2. RPLAs的三層人格分類框架

① 群體人格：基于LLMs中關于特定群體（如職業、種族）的統計特征，通過簡單的提示詞即可激活；② 角色人格：代表廣為人知的具體個體，如名人、歷史人物和虛構角色，需要模型理解和運用已有角色數據；③ 個性化人格：基于個性化用戶數據構建，強調個人獨特的經歷、需求和偏好，主要用于數字分身或個人助理等應用。

3. RPLAs的構建方法

RPLAs的構建主要依賴兩種方法：參數化訓練和非參數化提示。參數化訓練包括預訓練、監督微調和強化學習三個階段，旨在提升模型的角色扮演能力和特定角色知識。非參數化提示則在上下文中提供人格數據和角色扮演指令，這些數據可以通過在線資源收集、自動提取、對話合成和人工標注等方式獲取?，F代RPLAs通常還會集成記憶模塊，以提升交互體驗。

4. RPLAs的評估體系

RPLAs的評估主要分為兩類：角色扮演能力評估和人格還原度評估。前者關注擬人能力、吸引力和實用性等方面；后者則關注特定人格的RPLA是否很好地復制了目標人格的特點。目前主要的評估方法包括基于標準答案的自動評估、無標準答案的自動評估、多選題評估和人工評估，但每種方法都存在一定的局限性，對RPLAs的精準評估仍是一個開放性問題。

5. RPLAs面臨的挑戰與未來展望

盡管RPLAs展現出令人振奮的發展前景，但仍面臨諸多挑戰，例如構建更全面的角色數據集、實現更精準的評估方法、平衡真實性與安全性以及處理持續交互中的角色演變等。隨著技術的進步，培育人類與智能體協同共存的社會生態將成為重要方向，這將改變人機交互的方式，并推動數字生命這一人類長期追求的實現。

總而言之，這篇綜述論文為RPLAs的研究提供了寶貴的參考，也為未來研究指明了方向，相信隨著技術的不斷進步，RPLAs將在更多領域發揮作用，為人們帶來更加智能、個性化的互動體驗。

聯系作者

文章來源：新智元
作者微信：
作者簡介：智能+中國主平臺，致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展，關注人機融合、人工智能和機器人對人類社會與文明進化的影響，領航中國新智能時代。

閱讀原文

# AIGC動態 # AI個性化 # 三層人格框架 # 大模型人格 # 群體角色個性化 # 角色扮演AI

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

首篇「角色扮演AI」綜述！復旦等提出大模型三層人格分類框架：群體、角色、個性化 | TMLR

角色扮演AI：數字生命的曙光

1. RPLAs：模擬人類角色的AI系統

2. RPLAs的三層人格分類框架

3. RPLAs的構建方法

4. RPLAs的評估體系

5. RPLAs面臨的挑戰與未來展望

聯系作者

把RLHF帶給VLA模型！通過偏好對齊來優化機器人策略，代碼已開源

把訓練成本打下來99%！吊打GPT又“征服”OpenAI創始成員，DeepSeek“國產之光”實至名歸？

相關文章

暫無評論

ChatGPT

畢業論文生成器

AIGC熱點

首篇「角色扮演AI」綜述！復旦等提出大模型三層人格分類框架：群體、角色、個性化 | TMLR

角色扮演AI：數字生命的曙光

1. RPLAs：模擬人類角色的AI系統

2. RPLAs的三層人格分類框架

3. RPLAs的構建方法

4. RPLAs的評估體系

5. RPLAs面臨的挑戰與未來展望

聯系作者

把RLHF帶給VLA模型！通過偏好對齊來優化機器人策略，代碼已開源

把訓練成本打下來99%！吊打GPT又“征服”OpenAI創始成員，DeepSeek“國產之光”實至名歸？

相關文章

暫無評論

ChatGPT

畢業論文生成器

AIGC熱點

首篇「角色扮演AI」綜述！復旦等提出大模型三層人格分類框架：群體、角色、個性化 | TMLR

把RLHF帶給VLA模型！通過偏好對齊來優化機器人策略，代碼已開源

把訓練成本打下來99%！吊打GPT又“征服”OpenAI創始成員，DeepSeek“國產之光”實至名歸？