Meta發布抽象鏈，大模型工具利用精度+6%，速度+40%！

AIGC動態1年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：Meta發布抽象鏈，大模型工具利用精度+6%，速度+40%！
關鍵字：解讀,方法,工具,模型,數學
文章來源：夕小瑤科技說
內容字數：10238字

內容摘要：

夕小瑤科技說原創編輯 | 芒果引言：大語言模型與真實世界知識的對齊挑戰在人工智能領域，大型語言模型（LLMs）的發展已經取得了顯著進步，特別是在理解和執行指令方面。然而，當涉及到需要調用和組合真實世界知識來生成響應時，這些模型仍然存在錯誤。例如，它們可能會做出不符合事實的陳述或錯誤的計算。為了解決這些問題，研究人員提出了使用輔助工具（如搜索引擎提供可靠事實，計算器進行精確數算等）來減少這些錯誤，這激發了集成外部API調用到輸出生成中的工具增強型語言模型的發展。
盡管如此，當前的工具增強型LLMs，例如Toolformer，仍然面臨在多步推理中可靠和高效利用工具的挑戰。特別是在多步推理任務中，工具調用往往是交錯的，即一個API調用的響應常常是后續調用的一部分查詢。如果不顯式地建模這些推理鏈中的相互連接，LLMs將無法學習有效的工具使用規劃，導致使用工具的推理準確性降低。同時，將文本生成與API調用交錯也引入了推理效率低下的問題，模型必須等待API調用的響應才能繼續解碼過程。在多步推理場景中，這種低效率變得更加明顯，因為每個推理過程通常需要多輪API調用。
本文提出了一種新的方法，通

原文鏈接：Meta發布抽象鏈，大模型工具利用精度+6%，速度+40%！