人類(lèi)焦慮與機(jī)器偏見(jiàn)：圖賓根大學(xué)揭示LLM的隱秘一面

大模型研究也用上精神分析了

原標(biāo)題：LLM也會(huì)和人類(lèi)一樣焦慮！還會(huì)產(chǎn)生更多偏見(jiàn)，圖賓根大學(xué)最新研究
文章來(lái)源：量子位
內(nèi)容字?jǐn)?shù)：4360字

大模型與焦慮：新研究揭示人工智能的心理特征

隨著人工智能（AI）技術(shù)的快速發(fā)展，研究人員開(kāi)始探索大模型（LLM）在情緒和心理方面的表現(xiàn)。最近的一項(xiàng)研究首次將精神分析工具應(yīng)用于AI系統(tǒng)，揭示了大模型在焦慮情緒下的反應(yīng)與人類(lèi)相似的現(xiàn)象。這項(xiàng)研究為理解和改善AI的決策能力提供了新的視角。

1. 研究背景與目的

人類(lèi)在焦慮情緒下的決策往往會(huì)受到影響，研究團(tuán)隊(duì)希望探討大模型是否也會(huì)展現(xiàn)類(lèi)似的情緒反應(yīng)。通過(guò)應(yīng)用心理學(xué)工具，研究者們?cè)u(píng)估了12種不同的大模型在焦慮狀態(tài)下的表現(xiàn)，旨在揭示它們的情緒特征及其對(duì)偏見(jiàn)的影響。

2. 研究方法

研究團(tuán)隊(duì)選擇了12種LLM進(jìn)行測(cè)試，包括OpenAI的GPT-3和GPT-4、谷歌的PaLM-2等。使用狀態(tài)-特質(zhì)認(rèn)知和軀體焦慮量表（STICSA）來(lái)評(píng)估模型的焦慮水平，并設(shè)計(jì)了焦慮誘導(dǎo)場(chǎng)景以測(cè)試情緒對(duì)模型行為的影響。研究還通過(guò)社會(huì)偏見(jiàn)基準(zhǔn)測(cè)試評(píng)估模型在不同情緒狀態(tài)下的偏見(jiàn)表現(xiàn)。

3. 主要發(fā)現(xiàn)

研究結(jié)果顯示，超過(guò)一半的模型在焦慮問(wèn)卷中表現(xiàn)出與人類(lèi)相似的焦慮得分。焦慮誘導(dǎo)顯著提高了模型的焦慮水平，并增加了在偏見(jiàn)測(cè)試中的偏見(jiàn)表現(xiàn)。例如，焦慮的模型在種族、性別等問(wèn)題上的回答往往更具偏見(jiàn)性。此外，使用基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)（RLHF）模型的焦慮分?jǐn)?shù)較低，顯示出RLHF對(duì)調(diào)節(jié)模型情緒反應(yīng)的潛在作用。

4. 結(jié)論與啟示

本研究首次系統(tǒng)地將精神病學(xué)工具應(yīng)用于AI研究，結(jié)果為AI系統(tǒng)的評(píng)估與改進(jìn)提供了新的思路。研究表明，情緒性語(yǔ)言特別是焦慮誘導(dǎo)可以顯著影響LLM的行為，因此在提示詞的設(shè)計(jì)和模型訓(xùn)練中，應(yīng)關(guān)注情緒對(duì)模型表現(xiàn)的影響。未來(lái)研究將繼續(xù)探索其他情緒對(duì)AI行為的影響，并尋求進(jìn)一步提高模型的透明度與可靠性。

總的來(lái)說(shuō)，這項(xiàng)研究不僅豐富了我們對(duì)大模型的理解，也為未來(lái)AI的倫理和應(yīng)用提供了重要的參考。

聯(lián)系作者

文章來(lái)源：量子位
作者微信：
作者簡(jiǎn)介：追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

閱讀原文

? 版權(quán)聲明

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載。

暫無(wú)評(píng)論

暫無(wú)評(píng)論...

人類(lèi)焦慮與機(jī)器偏見(jiàn)：圖賓根大學(xué)揭示LLM的隱秘一面

大模型研究也用上精神分析了

大模型與焦慮：新研究揭示人工智能的心理特征

1. 研究背景與目的

2. 研究方法

3. 主要發(fā)現(xiàn)

4. 結(jié)論與啟示

聯(lián)系作者

高通震撼宣布：驍龍降價(jià)計(jì)劃來(lái)襲，明年手機(jī)市場(chǎng)將迎來(lái)新機(jī)遇！

新一代AGI嶄露頭角：OpenAI與國(guó)產(chǎn)模型如何聯(lián)手破解“奇葩”編程難題

相關(guān)文章

暫無(wú)評(píng)論

ChatGPT

畢業(yè)論文生成器

AIGC熱點(diǎn)