AIGC動態歡迎閱讀
原標題:連ChatGPT都懂“阿諛奉承”了!OpenAI最強競對:都是“人類偏好”犯的錯
文章來源:大數據文摘
內容字數:4243字
內容摘要:大數據文摘授權轉載自學術頭條你是否想過,ChatGPT 生成的答案會受到用戶個人偏好的影響,回復一些足夠“阿諛奉承(sycophancy)”的話,而非中立或真實的信息?實際上,這種現象存在于包括 ChatGPT 在內的大多數 AI 模型之中,而罪魁禍首竟可能是“基于人類反饋的強化學習(RLHF)”。近日,OpenAI 在美國硅谷的最強競爭對手 Anthropic 在研究經過 RLHF 訓練的模型時…
原文鏈接:點此閱讀原文:連ChatGPT都懂“阿諛奉承”了!OpenAI最強競對:都是“人類偏好”犯的錯
聯系作者
文章來源:大數據文摘
作者微信:BigDataDigest
作者簡介:普及數據思維,傳播數據文化
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...