?哪個模型擅長調(diào)用工具?這個7B模型躋身工具調(diào)用綜合榜單第一
AIGC動態(tài)歡迎閱讀
原標題:?哪個模型擅長調(diào)用工具?這個7B模型躋身工具調(diào)用綜合榜單第一
關鍵字:模型,工具,函數(shù),相關性,數(shù)據(jù)
文章來源:機器之心
內(nèi)容字數(shù):0字
內(nèi)容摘要:
AIxiv專欄是機器之心發(fā)布學術、技術內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學術交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.co工具調(diào)用是 AI 智能體的關鍵功能之一,AI 智能體根據(jù)場景變化動態(tài)地選擇和調(diào)用合適的工具,從而實現(xiàn)對復雜任務的自動化處理。例如,在智能辦公場景中,模型可同時調(diào)用文檔編輯工具、數(shù)據(jù)處理工具和通信工具,完成文檔撰寫、數(shù)據(jù)統(tǒng)計和信息溝通等多項任務。
業(yè)界已發(fā)布的工具調(diào)用模型,在特定評測基準上有接近甚至超越閉源 SOTA 模型(比如 GPT-4)的表現(xiàn),但在其他評測基準上下降明顯,難以泛化到新工具和新場景。為應對這一挑戰(zhàn),來自 OPPO 研究院和上海交通大學的研究團隊提出函數(shù)掩碼(Function Masking) 方法,構建了具備強大泛化能力的輕量化工具調(diào)用系列模型:Hammer,并開源了完整的技術棧,旨在幫助開發(fā)者構建個性化的終端智能應用。
在工具調(diào)用典型評測基準
原文鏈接:?哪個模型擅長調(diào)用工具?這個7B模型躋身工具調(diào)用綜合榜單第一
聯(lián)系作者
文章來源:機器之心
作者微信:
作者簡介: