<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        打破常規:LLM如何賦予AI真實的推理能力與程序性知識

        AIGC動態7個月前發布 新智元
        478 0 0

        打破常規:LLM如何賦予AI真實的推理能力與程序性知識

        原標題:AI做數學學會「動腦子」! UCL等發現LLM「程序性知識」,推理絕不是背答案
        文章來源:新智元
        內容字數:15901字

        LLM推理能力研究綜述

        在最新的研究中,來自UCL和Cohere等機構的研究人員探討了大型語言模型(LLM)在推理任務中的表現,發現它們并非簡單地檢索答案,而是通過一種稱為“程序性知識”的方式進行推理。這項研究揭示了LLM在處理推理任務時所依賴的知識和策略,為理解其推理能力提供了新的視角。

        1. 程序性知識的發現

        研究人員分析了LLM在執行推理任務時使用的預訓練數據,發現模型依賴于包含程序性知識的文檔。這些文檔提供了求解過程的示例,模型通過觀察這些示例來生成自己的推理過程。研究表明,LLM在面對不同推理任務時,所依賴的信息源并不相同,但在處理相似類型的問題時,其使用的文檔卻表現出一定的相似性。

        2. 推理與事實性問題的區別

        研究還發現,LLM在回答事實性問題時,答案通常出現在最具影響力的文檔中,而在推理問題中,答案的出現頻率則顯著降低。這表明,LLM在推理時的表現與其在事實性問題上的表現存在明顯差異,推理過程更依賴于從更廣泛的文檔集合中進行泛化,而對單個文檔的依賴程度較低。

        3. 數據污染與模型性能

        研究指出,LLM的推理能力受到訓練數據中類似問題頻率的嚴重影響。這引發了對“數據污染”的關注,即基準測試數據可能與預訓練數據重合,導致模型的泛化能力受到限制。因此,如何有效選擇和設計預訓練數據成為提升LLM推理能力的關鍵。

        4. 影響文檔的分析

        研究團隊利用影響函數分析了哪些文檔對模型輸出產生了重要影響,結果顯示,文檔中的程序性知識對推理過程的軌跡具有顯著預測能力。尤其是在處理數學推理問題時,包含代碼或公式的文檔更能有效支持模型的推理過程。

        5. 結論與未來展望

        總的來說,這項研究提供了LLM推理能力的新見解,表明其并非簡單的模式匹配器,而是通過程序性知識進行復雜推理的能力。未來的研究可以進一步探索如何利用這種程序性知識,優化LLM的預訓練策略,以提高其在多樣化推理任務中的表現。


        聯系作者

        文章來源:新智元
        作者微信:
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产亚洲精品美女久久久久久下载| 色吊丝免费观看网站| 国产精品美女午夜爽爽爽免费| 91在线亚洲综合在线| 国产成人免费高清在线观看| 久久国产一片免费观看| 亚洲国产中文在线视频| 免费在线视频一区| 114级毛片免费观看| 美女视频黄a视频全免费网站一区| 久久亚洲国产欧洲精品一| 久久精品无码一区二区三区免费| 一级毛片视频免费| 亚洲中文无码线在线观看| 亚洲av手机在线观看| 色婷婷精品免费视频| 亚洲中文字幕不卡无码| 久久久高清免费视频| 久久九九久精品国产免费直播| 亚洲人妖女同在线播放| 亚洲综合av永久无码精品一区二区| 免费黄色网址网站| 日本三级在线观看免费| 亚洲色少妇熟女11p| 亚洲三级电影网址| 亚洲免费一区二区| 全免费a级毛片免费看不卡| 久久免费视频观看| 欧亚一级毛片免费看| 亚洲中文字幕一区精品自拍| 香蕉蕉亚亚洲aav综合| 亚洲精品无码专区2| 免费高清小黄站在线观看| 中文字幕免费在线| a毛看片免费观看视频| 国产成人亚洲精品无码AV大片| 亚洲国产精品综合久久网各| 亚洲国产无套无码av电影| 亚洲男人天堂2020| 国产又大又粗又硬又长免费| 亚洲精品动漫免费二区|