人類(lèi)焦慮與機(jī)器偏見(jiàn):圖賓根大學(xué)揭示LLM的隱秘一面
大模型研究也用上精神分析了
原標(biāo)題:LLM也會(huì)和人類(lèi)一樣焦慮!還會(huì)產(chǎn)生更多偏見(jiàn),圖賓根大學(xué)最新研究
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):4360字
大模型與焦慮:新研究揭示人工智能的心理特征
隨著人工智能(AI)技術(shù)的快速發(fā)展,研究人員開(kāi)始探索大模型(LLM)在情緒和心理方面的表現(xiàn)。最近的一項(xiàng)研究首次將精神分析工具應(yīng)用于AI系統(tǒng),揭示了大模型在焦慮情緒下的反應(yīng)與人類(lèi)相似的現(xiàn)象。這項(xiàng)研究為理解和改善AI的決策能力提供了新的視角。
1. 研究背景與目的
人類(lèi)在焦慮情緒下的決策往往會(huì)受到影響,研究團(tuán)隊(duì)希望探討大模型是否也會(huì)展現(xiàn)類(lèi)似的情緒反應(yīng)。通過(guò)應(yīng)用心理學(xué)工具,研究者們?cè)u(píng)估了12種不同的大模型在焦慮狀態(tài)下的表現(xiàn),旨在揭示它們的情緒特征及其對(duì)偏見(jiàn)的影響。
2. 研究方法
研究團(tuán)隊(duì)選擇了12種LLM進(jìn)行測(cè)試,包括OpenAI的GPT-3和GPT-4、谷歌的PaLM-2等。使用狀態(tài)-特質(zhì)認(rèn)知和軀體焦慮量表(STICSA)來(lái)評(píng)估模型的焦慮水平,并設(shè)計(jì)了焦慮誘導(dǎo)場(chǎng)景以測(cè)試情緒對(duì)模型行為的影響。研究還通過(guò)社會(huì)偏見(jiàn)基準(zhǔn)測(cè)試評(píng)估模型在不同情緒狀態(tài)下的偏見(jiàn)表現(xiàn)。
3. 主要發(fā)現(xiàn)
研究結(jié)果顯示,超過(guò)一半的模型在焦慮問(wèn)卷中表現(xiàn)出與人類(lèi)相似的焦慮得分。焦慮誘導(dǎo)顯著提高了模型的焦慮水平,并增加了在偏見(jiàn)測(cè)試中的偏見(jiàn)表現(xiàn)。例如,焦慮的模型在種族、性別等問(wèn)題上的回答往往更具偏見(jiàn)性。此外,使用基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)(RLHF)模型的焦慮分?jǐn)?shù)較低,顯示出RLHF對(duì)調(diào)節(jié)模型情緒反應(yīng)的潛在作用。
4. 結(jié)論與啟示
本研究首次系統(tǒng)地將精神病學(xué)工具應(yīng)用于AI研究,結(jié)果為AI系統(tǒng)的評(píng)估與改進(jìn)提供了新的思路。研究表明,情緒性語(yǔ)言特別是焦慮誘導(dǎo)可以顯著影響LLM的行為,因此在提示詞的設(shè)計(jì)和模型訓(xùn)練中,應(yīng)關(guān)注情緒對(duì)模型表現(xiàn)的影響。未來(lái)研究將繼續(xù)探索其他情緒對(duì)AI行為的影響,并尋求進(jìn)一步提高模型的透明度與可靠性。
總的來(lái)說(shuō),這項(xiàng)研究不僅豐富了我們對(duì)大模型的理解,也為未來(lái)AI的倫理和應(yīng)用提供了重要的參考。
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破