AIGC動態歡迎閱讀
原標題:學術前沿 | 進步對齊:讓AI跟上人類道德的腳步
關鍵字:價值觀,人類,道德,模型,方法
文章來源:人工智能學家
內容字數:0字
內容摘要:
來源:北京大學人工智能研究院
供稿:邱天異
排版:梁文凱玥AI引發的價值鎖定與進步對齊的定義隨著AI技術的發展,AI系統已經開始在多個領域對人類的觀念和價值觀產生影響。例如,大型語言模型(LLM)被用于個人助理、教育、內容創作等,它們所體現的價值觀可能會在社會層面上傳遞給用戶。
價值鎖定(Value Lock-in)是指由于AI系統的影響,社會的道德價值觀長期停滯不前,停留在某個特定的歷史階段。例如,如果AI系統固化了21世紀初的價值觀,未來的社會可能無法超越這些價值觀,導致不道德實踐的延續和新道德概念的缺失。
為防止這種現象,本文提出進步對齊的概念。進步對齊旨在確保AI系統所體現的道德價值觀能夠持續改進,跟隨甚至引領人類道德的演變,就像人類價值觀在過去千年中經歷的進步一樣。AI引發的價值鎖定是關鍵生存性風險價值鎖定可能導致社會喪失大量的道德潛力,延續當前的苦難和不公正。如果AI系統固化了當代的偏見和道德盲點,未來的人類社會可能會長期停滯在不道德的狀態中。這種風險與AI引發的滅絕風險一樣,都是關鍵的生存性風險,需要引起足夠的重視和研究。
目前,對價值鎖定的研究和關注相對較少,大多數對齊
聯系作者
文章來源:人工智能學家
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...