企業(yè)要做大模型落地?建議進(jìn)來(lái)看看這個(gè)榜單
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:企業(yè)要做大模型落地?建議進(jìn)來(lái)看看這個(gè)榜單
關(guān)鍵字:模型,幻覺(jué),問(wèn)題,數(shù)據(jù),機(jī)器
文章來(lái)源:夕小瑤科技說(shuō)
內(nèi)容字?jǐn)?shù):8837字
內(nèi)容摘要:夕小瑤科技說(shuō) 原創(chuàng)作者 | 賣萌醬機(jī)器幻覺(jué)問(wèn)題,可能是未來(lái)相當(dāng)長(zhǎng)一段時(shí)間內(nèi)懸浮在大模型領(lǐng)域上方的兩片烏云之一。遙記半年前,LeCun 就曾斷言:“單純根據(jù)概率生成自回歸的大語(yǔ)言模型,根本解決不了幻覺(jué)、錯(cuò)誤的問(wèn)題,GPT模型活不過(guò)5年”。當(dāng)然,盡管 LeCun 話雖如此,但是我們可以看到,自 GPT 系列模型問(wèn)世以來(lái),無(wú)論是簡(jiǎn)單粗暴擴(kuò)展模型參數(shù),還是精心調(diào)配,使用微調(diào)、RLHF 實(shí)現(xiàn)對(duì)齊,總體而言,大模型還是在朝著減輕機(jī)器幻覺(jué),增加可信度的大方向不斷向前發(fā)展的。如下圖所示,左右兩幅圖分別展示了應(yīng)用對(duì)齊技術(shù)(下圖左)以及擴(kuò)展模型參數(shù)量(下圖右)為大模型可信度帶來(lái)的提升。依靠大模型這條已經(jīng)被證明至少是部分“可行”的技術(shù)路徑,如果希望減輕機(jī)器幻覺(jué),那么首當(dāng)其沖,不是提出什么新理論新方法新技術(shù),而是必須首先對(duì)大模型望聞問(wèn)切,檢查一下目前大模型確有幻覺(jué),識(shí)別出大模型有什么樣的幻覺(jué),才有可能有的放矢,對(duì)…
原文鏈接:點(diǎn)此閱讀原文:企業(yè)要做大模型落地?建議進(jìn)來(lái)看看這個(gè)榜單
聯(lián)系作者
文章來(lái)源:夕小瑤科技說(shuō)
作者微信:xixiaoyaoQAQ
作者簡(jiǎn)介:更快的AI前沿,更深的行業(yè)洞見(jiàn)。聚集25萬(wàn)AI應(yīng)用開(kāi)發(fā)者、算法工程師和研究人員。一線作者均來(lái)自清北、國(guó)外頂級(jí)AI實(shí)驗(yàn)室和互聯(lián)網(wǎng)大廠,兼?zhèn)涿襟wsense與技術(shù)深度。