學(xué)術(shù)前沿 | 進(jìn)步對(duì)齊:讓AI跟上人類道德的腳步

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:學(xué)術(shù)前沿 | 進(jìn)步對(duì)齊:讓AI跟上人類道德的腳步
關(guān)鍵字:價(jià)值觀,人類,道德,模型,方法
文章來源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
來源:北京大學(xué)人工智能研究院
供稿:邱天異
排版:梁文凱玥AI引發(fā)的價(jià)值鎖定與進(jìn)步對(duì)齊的定義隨著AI技術(shù)的發(fā)展,AI系統(tǒng)已經(jīng)開始在多個(gè)領(lǐng)域?qū)θ祟惖挠^念和價(jià)值觀產(chǎn)生影響。例如,大型語言模型(LLM)被用于個(gè)人助理、教育、內(nèi)容創(chuàng)作等,它們所體現(xiàn)的價(jià)值觀可能會(huì)在社會(huì)層面上傳遞給用戶。
價(jià)值鎖定(Value Lock-in)是指由于AI系統(tǒng)的影響,社會(huì)的道德價(jià)值觀長期停滯不前,停留在某個(gè)特定的歷史階段。例如,如果AI系統(tǒng)固化了21世紀(jì)初的價(jià)值觀,未來的社會(huì)可能無法超越這些價(jià)值觀,導(dǎo)致不道德實(shí)踐的延續(xù)和新道德概念的缺失。
為防止這種現(xiàn)象,本文提出進(jìn)步對(duì)齊的概念。進(jìn)步對(duì)齊旨在確保AI系統(tǒng)所體現(xiàn)的道德價(jià)值觀能夠持續(xù)改進(jìn),跟隨甚至引領(lǐng)人類道德的演變,就像人類價(jià)值觀在過去千年中經(jīng)歷的進(jìn)步一樣。AI引發(fā)的價(jià)值鎖定是關(guān)鍵生存性風(fēng)險(xiǎn)價(jià)值鎖定可能導(dǎo)致社會(huì)喪失大量的道德潛力,延續(xù)當(dāng)前的苦難和不公正。如果AI系統(tǒng)固化了當(dāng)代的偏見和道德盲點(diǎn),未來的人類社會(huì)可能會(huì)長期停滯在不道德的狀態(tài)中。這種風(fēng)險(xiǎn)與AI引發(fā)的滅絕風(fēng)險(xiǎn)一樣,都是關(guān)鍵的生存性風(fēng)險(xiǎn),需要引起足夠的重視和研究。
目前,對(duì)價(jià)值鎖定的研究和關(guān)注相對(duì)較少,大多數(shù)對(duì)齊
原文鏈接:學(xué)術(shù)前沿 | 進(jìn)步對(duì)齊:讓AI跟上人類道德的腳步
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:
作者簡介:

粵公網(wǎng)安備 44011502001135號(hào)