<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        突破幻想:杜克大學(xué)與谷歌聯(lián)合推出SLED解碼框架,提升大語(yǔ)言模型的事實(shí)準(zhǔn)確性

        與梯度下降等經(jīng)典優(yōu)化算法銜接更為緊密自然

        突破幻想:杜克大學(xué)與谷歌聯(lián)合推出SLED解碼框架,提升大語(yǔ)言模型的事實(shí)準(zhǔn)確性

        原標(biāo)題:NeurIPS 2024|杜克大學(xué)&谷歌提出SLED解碼框架無(wú)需外部數(shù)據(jù)與額外訓(xùn)練,有效緩解大語(yǔ)言模型幻覺(jué),提高事實(shí)準(zhǔn)確性
        文章來(lái)源:機(jī)器之心
        內(nèi)容字?jǐn)?shù):4361字

        自驅(qū)動(dòng) Logits 進(jìn)化解碼(SLED)提升大語(yǔ)言模型的事實(shí)準(zhǔn)確性

        近年來(lái),大語(yǔ)言模型(LLM)在多種任務(wù)中展現(xiàn)了卓越的性能,但幻覺(jué)(hallucination)現(xiàn)象導(dǎo)致其生成內(nèi)容的準(zhǔn)確性受到限制。為了解決這一問(wèn)題,杜克大學(xué)與 Google Research 的研究團(tuán)隊(duì)提出了一種新的解碼框架——自驅(qū)動(dòng) Logits 進(jìn)化解碼(SLED),旨在提升 LLM 的事實(shí)準(zhǔn)確性。該方法不依賴外部知識(shí)庫(kù)或額外微調(diào),為模型的實(shí)際應(yīng)用提供了更高的可靠性。

        研究背景與思路

        研究者指出,雖然用戶可能無(wú)法得到 LLM 的正確答案,但模型內(nèi)部存儲(chǔ)的“潛在知識(shí)”可能包含正確的信息。該研究的重點(diǎn)在于如何挖掘這些潛在知識(shí),并利用其增強(qiáng)模型輸出的準(zhǔn)確性。SLED 方法通過(guò)對(duì)比 LLM 不同層的輸出,挖掘潛在知識(shí),并通過(guò)一種“梯度下降”方式將其整合到原始輸出中,從而有效提升事實(shí)準(zhǔn)確性。

        方法設(shè)計(jì)

        SLED 方法通過(guò)優(yōu)化損失函數(shù) L 來(lái)提高輸出中正確 token 的概率,實(shí)現(xiàn) Logits 進(jìn)化。研究者還發(fā)現(xiàn),LLM 的訓(xùn)練實(shí)際上是一個(gè)由外部驅(qū)動(dòng)的 Logits 進(jìn)化過(guò)程,最后一層的輸出通常更接近真實(shí)世界的分布。基于此,研究者通過(guò)反向估計(jì)潛在知識(shí),最終實(shí)現(xiàn)更接近事實(shí)分布的輸出。

        實(shí)驗(yàn)驗(yàn)證

        研究團(tuán)隊(duì)將 SLED 與當(dāng)前最先進(jìn)的方法 DoLa 進(jìn)行了比較,涵蓋多種 LLM 家族和不同規(guī)模的模型。實(shí)驗(yàn)結(jié)果顯示,SLED 在多項(xiàng)任務(wù)中均顯著提升了事實(shí)準(zhǔn)確性,并且與其他解碼方式兼容良好。更重要的是,SLED 在計(jì)算上幾乎沒(méi)有額外開(kāi)銷,且有效抑制了重復(fù)性問(wèn)題,優(yōu)化了輸出質(zhì)量。

        未來(lái)展望

        SLED 為后續(xù)推理時(shí)算法提供了新的框架,結(jié)合經(jīng)典優(yōu)化算法提高了效率。未來(lái)的研究方向可以探索將 SLED 與監(jiān)督式微調(diào)結(jié)合,以適應(yīng)特定領(lǐng)域的需求。此外,改進(jìn)框架設(shè)計(jì)也是后續(xù)研究的重點(diǎn)。

        通過(guò)引入 SLED 方法,本研究成功提升了 LLM 在多種任務(wù)中的事實(shí)準(zhǔn)確性,為模型的實(shí)際應(yīng)用提供了更可靠的支持。


        聯(lián)系作者

        文章來(lái)源:機(jī)器之心
        作者微信:
        作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無(wú)評(píng)論

        暫無(wú)評(píng)論...
        主站蜘蛛池模板: 亚洲视频在线观看网址| 国产免费观看a大片的网站| 久久成人无码国产免费播放| 99爱在线观看免费完整版| 最近2019中文免费字幕| 国产成人在线观看免费网站| 国产成人亚洲综合色影视| wwwxxx亚洲| 二区久久国产乱子伦免费精品| 亚洲视频免费在线播放| 亚洲国产一区二区三区| 亚洲系列中文字幕| jzzjzz免费观看大片免费| 91九色精品国产免费| 亚洲无码高清在线观看| 亚洲国产成a人v在线观看| 夜夜嘿视频免费看| 亚洲国产综合精品中文第一区| 亚洲AV日韩AV永久无码色欲| 小草在线看片免费人成视久网| 亚洲AV蜜桃永久无码精品| 亚洲国产精品久久久久秋霞影院| 亚洲欧洲精品在线| 成人免费无码大片A毛片抽搐色欲 成人免费无码大片a毛片 | 亚洲一线产区二线产区精华| 国产精品1024在线永久免费| 亚洲人成精品久久久久| 色婷婷亚洲一区二区三区| 无码国产精品一区二区免费3p| 亚洲理论片在线观看| 成人永久福利免费观看| 亚洲1区1区3区4区产品乱码芒果 | 日韩精品免费电影| 久久国产精品免费一区| 四虎永久在线精品免费观看地址 | 亚洲ts人妖网站| 亚洲一级Av无码毛片久久精品 | 亚洲精品永久在线观看| 久久久久久精品成人免费图片| 亚洲av色福利天堂| 免费精品一区二区三区第35|