<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Deepmind 重磅開(kāi)源:消除幻覺(jué),讓 LLMs 學(xué)會(huì)規(guī)則庫(kù)和多步推理

        Deepmind 重磅開(kāi)源:消除幻覺(jué),讓 LLMs 學(xué)會(huì)規(guī)則庫(kù)和多步推理

        原標(biāo)題:Deepmind 重磅開(kāi)源:消除幻覺(jué),讓 LLMs 學(xué)會(huì)規(guī)則庫(kù)和多步推理
        文章來(lái)源:夕小瑤科技說(shuō)
        內(nèi)容字?jǐn)?shù):6603字

        Google DeepMind開(kāi)源LLMs推理規(guī)則庫(kù):攻克大模型幻覺(jué)難題

        2024年12月,大模型發(fā)展如火如荼,但模型推理中的“幻覺(jué)”問(wèn)題依然是AI測(cè)評(píng)的焦點(diǎn)。Google DeepMind團(tuán)隊(duì)在圣誕節(jié)之際開(kāi)源了其關(guān)于LLMs訓(xùn)練規(guī)則推理庫(kù)的代碼,為解決這一難題提供了新的思路。該研究論文題目為《大型語(yǔ)言模型可以學(xué)習(xí)規(guī)則》(Large Language Models can Learn Rules),其核心框架是“從假設(shè)到理論”(HtT,Hypotheses-to-Theories)。

        1. 推理、事實(shí)與規(guī)則:基礎(chǔ)概念

        文章首先闡述了推理、事實(shí)和規(guī)則之間的關(guān)系。推理是從事實(shí)推導(dǎo)規(guī)則的過(guò)程,事實(shí)是已知信息,規(guī)則是潛在的邏輯關(guān)系。推理分為演繹推理(事實(shí)+規(guī)則->事實(shí))和歸納推理(事實(shí)+事實(shí)+…+事實(shí)->規(guī)則)。LLMs的訓(xùn)練過(guò)程可以視為歸納推理,而應(yīng)用規(guī)則進(jìn)行計(jì)算則為演繹推理。LLMs推理的難點(diǎn)在于如何有效匹配事實(shí)和對(duì)應(yīng)的規(guī)則。

        2. 從假設(shè)到理論(HtT)框架

        為了解決LLMs推理難題,DeepMind提出了HtT框架。該框架由歸納階段和演繹階段組成,兩者都通過(guò)少量樣本提示實(shí)現(xiàn)。

        1. 歸納階段:從訓(xùn)練示例中學(xué)習(xí)規(guī)則,并根據(jù)覆蓋度和置信度過(guò)濾規(guī)則,形成規(guī)則庫(kù)。DeepMind提出了一種“從演繹中歸納”的方法,使用同一個(gè)演繹推理提示進(jìn)行規(guī)則生成和驗(yàn)證,提高了推理準(zhǔn)確率。

        2. 演繹階段:利用歸納階段生成的規(guī)則庫(kù)來(lái)解決測(cè)試問(wèn)題。為了克服LLMs在檢索大量規(guī)則時(shí)的困難,DeepMind采用了一種層次化的規(guī)則庫(kù)組織方式,并使用XML標(biāo)簽進(jìn)行明確引用。

        3. 推理測(cè)試與實(shí)驗(yàn)結(jié)果

        DeepMind分別在關(guān)系推理、數(shù)值推理和概念學(xué)習(xí)三個(gè)任務(wù)上對(duì)HtT框架進(jìn)行了評(píng)估,并進(jìn)行了消融實(shí)驗(yàn)。

        1. 關(guān)系推理:在CLUTRR數(shù)據(jù)集上,HtT顯著提高了GPT-3.5和GPT-4的準(zhǔn)確率。

        2. 數(shù)值推理:在Arithmetic數(shù)據(jù)集上,HtT同樣提升了模型在非十進(jìn)制加法等問(wèn)題上的準(zhǔn)確率。

        3. 概念學(xué)習(xí):在List Functions數(shù)據(jù)集上,HtT提高了模型學(xué)習(xí)和應(yīng)用復(fù)雜規(guī)則的能力。

        消融實(shí)驗(yàn)表明,HtT的性能提升主要源于減少了錯(cuò)誤規(guī)則的生成,并且學(xué)習(xí)到的規(guī)則并非隨機(jī)的。

        4. 全文總結(jié)

        HtT框架通過(guò)顯式學(xué)習(xí)和應(yīng)用規(guī)則,顯著提高了LLMs在各種推理任務(wù)上的性能,有效降低了“幻覺(jué)”問(wèn)題的發(fā)生。雖然HtT目前仍受限于模型基礎(chǔ)能力和上下文長(zhǎng)度,但其為解決LLMs推理問(wèn)題提供了新的方向,具有很大的發(fā)展?jié)摿Α?/p>


        聯(lián)系作者

        文章來(lái)源:夕小瑤科技說(shuō)
        作者微信:
        作者簡(jiǎn)介:低負(fù)擔(dān)解碼AI世界,硬核也可愛(ài)!聚集35萬(wàn)AI發(fā)燒友、開(kāi)發(fā)者和從業(yè)者,廣泛覆蓋互聯(lián)網(wǎng)大廠中高管、AI公司創(chuàng)始人和機(jī)構(gòu)投資人。一線作者來(lái)自清北、國(guó)內(nèi)外頂級(jí)AI實(shí)驗(yàn)室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺(jué)和洞察深度。商務(wù)合作:zym5189

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無(wú)評(píng)論

        暫無(wú)評(píng)論...
        主站蜘蛛池模板: 亚洲国产人成网站在线电影动漫 | 亚洲精品V天堂中文字幕| 亚洲暴爽av人人爽日日碰| 97免费人妻无码视频| 亚洲乱码日产精品a级毛片久久| 亚洲成AV人片在线观看ww| 亚洲精品乱码久久久久久V| 欧美日韩国产免费一区二区三区| 中文字幕亚洲无线码a| 亚洲精品午夜国产va久久| 日批视频网址免费观看| 午夜性色一区二区三区免费不卡视频| 免费一级肉体全黄毛片| 亚洲国产成人精品无码区在线秒播 | 亚洲欧洲精品成人久久曰影片| 亚洲人成网亚洲欧洲无码| 日韩伦理片电影在线免费观看| 久久精品国产亚洲AV无码麻豆 | 国产成人无码区免费内射一片色欲| 日韩吃奶摸下AA片免费观看| 亚洲黄色在线观看网站| 久久久精品国产亚洲成人满18免费网站 | 亚洲AV第一页国产精品| 美女被吸屁股免费网站| aa级一级天堂片免费观看| 亚洲VA中文字幕不卡无码| 牛牛在线精品观看免费正| 女人18毛片特级一级免费视频| 久久综合亚洲鲁鲁五月天| 在线观看的免费网站| 国产成人人综合亚洲欧美丁香花| 久久受www免费人成_看片中文| 亚洲欧美熟妇综合久久久久| 又色又污又黄无遮挡的免费视| 精品久久久久久无码免费| 亚洲精品视频免费看| 最刺激黄a大片免费网站| 亚洲国产精久久久久久久| 青青青免费国产在线视频小草| 羞羞视频网站免费入口| 人人狠狠综合久久亚洲88|