專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法
AIGC動態(tài)歡迎閱讀
原標(biāo)題:專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法
關(guān)鍵字:故障,模型,報告,作者,數(shù)據(jù)
文章來源:新智元
內(nèi)容字?jǐn)?shù):7183字
內(nèi)容摘要:
新智元報道編輯:LRS
【新智元導(dǎo)讀】針對大模型偶發(fā)腦回路故障難題,最新研究GlitchHunter收集了大量故障詞元,并針對不同情況進(jìn)行分類,極大改善了大模型的輸出質(zhì)量。如今,大型語言模型(LLM)已經(jīng)成為了我們生活中的好幫手。
當(dāng)用戶使用大模型時,模型首先會將輸入的內(nèi)容拆分成一個個的詞元(token),通過分析這些詞元來生成答案,為我們解答疑惑、提供建議、翻譯外語、撰寫報告······但是,你能想象大模型也會出錯嗎?
想象一下,你正在使用最新款的智能手機(jī),它快速、聰明、幾乎可以做任何你想要的事情。
但偶爾,你發(fā)現(xiàn)手機(jī)的一兩個按鍵不按常理出牌——比如說,你按下「S」,它偏偏跳出「E」,或者干脆點了沒反應(yīng),那估計用的時候就只想砸手機(jī)了。
大模型中存在一些故障詞元(glitch token),一個個本應(yīng)協(xié)助模型流暢運行的小小詞元,偏偏要搞點小破壞。針對這個情況,由華中科技大學(xué)、南洋理工大學(xué)等高校聯(lián)合組成的研究團(tuán)隊近日發(fā)表了一項研究,該工作已經(jīng)被軟件工程領(lǐng)域國際頂級會議——FSE 2024接收。論文鏈接:https://arxiv.org/abs/2404.09894
項目鏈接:http
原文鏈接:專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對人類社會與文明進(jìn)化的影響,領(lǐng)航中國新智能時代。