3B模型新SOTA!開源AI讓日常調(diào)用不同大模型更簡單
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:3B模型新SOTA!開源AI讓日常調(diào)用不同大模型更簡單
關(guān)鍵字:模型,節(jié)點(diǎn),語言,工作,任務(wù)
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
NEXA AI 投稿量子位 | 公眾號(hào) QbitAI大模型,大,能力強(qiáng),好用!
但單一大模型在算力、數(shù)據(jù)和能耗方面面臨巨大的限制,且消耗大量資源。
而且目前最強(qiáng)大的模型大多為閉源,對(duì)AI開發(fā)的速度、安全性和公平性有所限制。
AI大模型的未來發(fā)展趨勢(shì),需要怎么在單一大模型和多個(gè)專門化小模型之間做平衡和選擇?
針對(duì)如此現(xiàn)狀,兩位斯坦福校友創(chuàng)辦的NEXA AI,提出了一種新的方法:
采用functional token整合了多個(gè)開源模型,每個(gè)模型都針對(duì)特定任務(wù)進(jìn)行了優(yōu)化。
他們開發(fā)了一個(gè)名叫Octopus v4的模型,利用functional token智能地將用戶查詢引導(dǎo)至最合適的垂直模型,并重新格式化查詢以實(shí)現(xiàn)最佳性能。
介紹一下,Octopus v4是前代系列模型的演化,擅長選擇和參數(shù)理解與重組。
此外,團(tuán)隊(duì)還探索了使用圖作為一種多功能數(shù)據(jù)結(jié)構(gòu),有效地協(xié)調(diào)多個(gè)開源模型,利用Octopus模型和functional token的能力。
通過激活約100億參數(shù)的模型,Octopus v4在同級(jí)別模型中實(shí)現(xiàn)了74.8的SOTA MMLU分?jǐn)?shù)。
Octopus系列模型這里要重點(diǎn)介紹一下Octo
原文鏈接:3B模型新SOTA!開源AI讓日常調(diào)用不同大模型更簡單
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破