RLHF再也不需要人類了!谷歌團(tuán)隊(duì)研究證明,AI標(biāo)注已達(dá)人類水平
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:RLHF再也不需要人類了!谷歌團(tuán)隊(duì)研究證明,AI標(biāo)注已達(dá)人類水平
關(guān)鍵字:研究人員,模型,人類,摘要,數(shù)據(jù)
文章來源:新智元
內(nèi)容字?jǐn)?shù):11280字
內(nèi)容摘要:新智元報(bào)道編輯:編輯部【新智元導(dǎo)讀】ChatGPT橫空出世后,RLHF成為研究人員關(guān)注的焦點(diǎn)。谷歌最新研究提出,不用人類標(biāo)注,AI標(biāo)注偏好后,也能取得與RLHF一樣的效果。如果說,RLHF中的「人類」被取代,可行嗎?谷歌團(tuán)隊(duì)的最新研究提出了,用大模型替代人類,進(jìn)行偏好標(biāo)注,也就是AI反饋強(qiáng)化學(xué)習(xí)(RLAIF)。論文地址:https://arxiv.org/abs/2309.00267結(jié)果發(fā)現(xiàn),RL…
原文鏈接:點(diǎn)此閱讀原文:RLHF再也不需要人類了!谷歌團(tuán)隊(duì)研究證明,AI標(biāo)注已達(dá)人類水平
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載。
相關(guān)文章
暫無評(píng)論...