模型A:幸虧有你,我才不得0分,模型B:俺也一樣

AIGC動態(tài)歡迎閱讀
原標(biāo)題:模型A:幸虧有你,我才不得0分,模型B:俺也一樣
關(guān)鍵字:模型,任務(wù),算術(shù),語言,能力
文章來源:機器之心
內(nèi)容字數(shù):9068字
內(nèi)容摘要:
機器之心報道
機器之心編輯部現(xiàn)在大模型都學(xué)會借力了。琳瑯滿目的樂高積木,通過一塊又一塊的疊加,可以創(chuàng)造出各種栩栩如生的人物、景觀等,不同的樂高作品相互組合,又能為愛好者帶來新的創(chuàng)意。
我們把思路打開一點,在大模型(LLM)爆發(fā)的當(dāng)下,我們能不能像拼積木一樣,把不同的模型搭建起來,而不會影響原來模型的功能,還能起到 1+1>2 的效果。
這樣的想法,谷歌已經(jīng)實現(xiàn)了。他們的研究為未來的語言模型發(fā)展提供了一個新的方向,特別是在資源節(jié)約和模型適應(yīng)性方面。如今的大語言模型(LLM)仿佛一個全能戰(zhàn)士,能進行常識和事實推理、懂得世界知識、生成連貫的文本…… 在這些基礎(chǔ)功能的底座上,研究者們又進行了一系列努力對這些模型進行微調(diào),以實現(xiàn)特定于領(lǐng)域的功能,如代碼生成、文案編輯以及解決數(shù)學(xué)問題等。
但這些特定于領(lǐng)域的模型開始出現(xiàn)一些棘手的問題,例如,有些模型在標(biāo)準(zhǔn)代碼生成方面做得很好,但在一般邏輯推理方面并不精通,反之亦然。
我們不禁要問:是否可以將 anchor 模型(即具有基礎(chǔ)功能的模型)與特定于領(lǐng)域的增強模型組合在一起,從而開啟模型新功能?例如,我們能否將理解代碼的增強模型與 anchor 模型的語言
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

粵公網(wǎng)安備 44011502001135號