AIGC動態歡迎閱讀
原標題:今日arXiv最熱NLP大模型論文:清華大學:大語言模型的常見詞僻意理解能力竟不如中學生
關鍵字:模型,語義,能力,提示,任務
文章來源:夕小瑤科技說
內容字數:10424字
內容摘要:
夕小瑤科技說 原創作者 | 謝年年LLMs在各種下游任務上都表現出色,翻譯、寫詩、寫故事信手拈來,甚至在某些任務上超過了人類水平。
如果是一個人擅長翻譯,那我們會覺得他充分掌握了兩門語言體系,精通雙語。但是LLMs也是如此嗎?LLMs是真的掌握了兩門語言,還是僅僅從大規模的訓練數據中歸納出語言特征,學會了模仿。
因此 “LLMs是真正理解了世界,還是只是模仿語言模式和邏輯的隨機鸚鵡?”。這一疑問引發了眾多研究并激起了激烈的爭論。
目前主流研究主要集中在表層自然語言理解任務如了LLMs在句子級別理解社交語言的能力、重復句子檢測等,而忽視了細粒度的探索。為了填補這一空白,清華大學深入探討了LLMs對微妙語義理解能力,特別是對常見詞匯的不尋常含義,構建了LeSC(Lexical Semantic Comprehension)數據集來評估LLMs對單詞級自然語言理解能力。
簡單來說, 作者使用高考和大學英語考試的數據為LLMs量身打造了單詞釋義理解任務,這些單詞的正確含義往往不是常見的釋義。如下圖所示,讓LLMs選擇“air”一詞在該句子中所代表的中文含義。“air”此時不是“空氣”的意思。
原文鏈接:今日arXiv最熱NLP大模型論文:清華大學:大語言模型的常見詞僻意理解能力竟不如中學生
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189