模型A：幸虧有你，我才不得0分，模型B：俺也一樣

AIGC動態(tài)2年前 (2024)發(fā)布機器之心

AIGC動態(tài)歡迎閱讀

原標(biāo)題：模型A：幸虧有你，我才不得0分，模型B：俺也一樣
關(guān)鍵字：模型,任務(wù),算術(shù),語言,能力
文章來源：機器之心
內(nèi)容字數(shù)：9068字

內(nèi)容摘要：

機器之心報道
機器之心編輯部現(xiàn)在大模型都學(xué)會借力了。琳瑯滿目的樂高積木，通過一塊又一塊的疊加，可以創(chuàng)造出各種栩栩如生的人物、景觀等，不同的樂高作品相互組合，又能為愛好者帶來新的創(chuàng)意。
我們把思路打開一點，在大模型（LLM）爆發(fā)的當(dāng)下，我們能不能像拼積木一樣，把不同的模型搭建起來，而不會影響原來模型的功能，還能起到 1+1>2 的效果。
這樣的想法，谷歌已經(jīng)實現(xiàn)了。他們的研究為未來的語言模型發(fā)展提供了一個新的方向，特別是在資源節(jié)約和模型適應(yīng)性方面。如今的大語言模型（LLM）仿佛一個全能戰(zhàn)士，能進行常識和事實推理、懂得世界知識、生成連貫的文本…… 在這些基礎(chǔ)功能的底座上，研究者們又進行了一系列努力對這些模型進行微調(diào)，以實現(xiàn)特定于領(lǐng)域的功能，如代碼生成、文案編輯以及解決數(shù)學(xué)問題等。
但這些特定于領(lǐng)域的模型開始出現(xiàn)一些棘手的問題，例如，有些模型在標(biāo)準(zhǔn)代碼生成方面做得很好，但在一般邏輯推理方面并不精通，反之亦然。
我們不禁要問：是否可以將 anchor 模型（即具有基礎(chǔ)功能的模型）與特定于領(lǐng)域的增強模型組合在一起，從而開啟模型新功能？例如，我們能否將理解代碼的增強模型與 anchor 模型的語言

原文鏈接：模型A：幸虧有你，我才不得0分，模型B：俺也一樣