AIGC動態歡迎閱讀
原標題:首屆大模型頂會COLM 高分論文:偏好搜索算法PairS,讓大模型進行文本評估更高效
關鍵字:偏見,人類,算法,模型,高效
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com文章作者皆為來自劍橋大學語言技術實驗室,一作為三年級博士生劉胤宏,導師為教授 Nigel Collier 和 Ehsan Shareghi。他的研究興趣是大模型和文本評估,數據生成等。共同一作為二年級博士生周涵,導師為教授 Anna Korhonen 和 Ivan Vuli?,他的研究興趣是高效大模型。
大模型展現出了卓越的指令跟從和任務泛化的能力,這種獨特的能力源自 LLMs 在訓練中使用了指令跟隨數據以及人類反饋強化學習(RLHF)。在 RLHF 訓練范式中,獎勵模型根據排名比較數據與人類偏好對齊。這增強了 LLMs 與人類價值觀的對齊,從而生成更好地幫助人類并遵守人類價值觀的回應。
近日,第一屆大模型頂會 COLM 剛剛公布接收結果,其中一項高分工作分析
原文鏈接:首屆大模型頂會COLM 高分論文:偏好搜索算法PairS,讓大模型進行文本評估更高效
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...