連ChatGPT都懂“阿諛奉承”了!OpenAI最強(qiáng)競(jìng)對(duì):都是“人類偏好”犯的錯(cuò)
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:連ChatGPT都懂“阿諛奉承”了!OpenAI最強(qiáng)競(jìng)對(duì):都是“人類偏好”犯的錯(cuò)
文章來源:大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù):4243字
內(nèi)容摘要:大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自學(xué)術(shù)頭條你是否想過,ChatGPT 生成的答案會(huì)受到用戶個(gè)人偏好的影響,回復(fù)一些足夠“阿諛奉承(sycophancy)”的話,而非中立或真實(shí)的信息?實(shí)際上,這種現(xiàn)象存在于包括 ChatGPT 在內(nèi)的大多數(shù) AI 模型之中,而罪魁禍?zhǔn)拙箍赡苁恰盎谌祟惙答伒膹?qiáng)化學(xué)習(xí)(RLHF)”。近日,OpenAI 在美國硅谷的最強(qiáng)競(jìng)爭(zhēng)對(duì)手 Anthropic 在研究經(jīng)過 RLHF 訓(xùn)練的模型時(shí)…
原文鏈接:點(diǎn)此閱讀原文:連ChatGPT都懂“阿諛奉承”了!OpenAI最強(qiáng)競(jìng)對(duì):都是“人類偏好”犯的錯(cuò)
聯(lián)系作者
文章來源:大數(shù)據(jù)文摘
作者微信:BigDataDigest
作者簡(jiǎn)介:普及數(shù)據(jù)思維,傳播數(shù)據(jù)文化
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載。
相關(guān)文章
暫無評(píng)論...