今日arXiv最熱NLP大模型論文：清華大學：大語言模型的常見詞僻意理解能力竟不如中學生

AIGC動態(tài)1年前 (2024)發(fā)布夕小瑤科技說

AIGC動態(tài)歡迎閱讀

原標題：今日arXiv最熱NLP大模型論文：清華大學：大語言模型的常見詞僻意理解能力竟不如中學生
關鍵字：模型,語義,能力,提示,任務
文章來源：夕小瑤科技說
內(nèi)容字數(shù)：10424字

內(nèi)容摘要：

夕小瑤科技說原創(chuàng)作者 | 謝年年LLMs在各種下游任務上都表現(xiàn)出色，翻譯、寫詩、寫故事信手拈來，甚至在某些任務上超過了人類水平。
如果是一個人擅長翻譯，那我們會覺得他充分掌握了兩門語言體系，精通雙語。但是LLMs也是如此嗎？LLMs是真的掌握了兩門語言，還是僅僅從大規(guī)模的訓練數(shù)據(jù)中歸納出語言特征，學會了模仿。
因此 “LLMs是真正理解了世界，還是只是模仿語言模式和邏輯的隨機鸚鵡？”。這一疑問引發(fā)了眾多研究并激起了激烈的爭論。
目前主流研究主要集中在表層自然語言理解任務如了LLMs在句子級別理解社交語言的能力、重復句子檢測等，而忽視了細粒度的探索。為了填補這一空白，清華大學深入探討了LLMs對微妙語義理解能力，特別是對常見詞匯的不尋常含義，構建了LeSC（Lexical Semantic Comprehension）數(shù)據(jù)集來評估LLMs對單詞級自然語言理解能力。
簡單來說，作者使用高考和大學英語考試的數(shù)據(jù)為LLMs量身打造了單詞釋義理解任務，這些單詞的正確含義往往不是常見的釋義。如下圖所示，讓LLMs選擇“air”一詞在該句子中所代表的中文含義。“air”此時不是“空氣”的意思。

原文鏈接：今日arXiv最熱NLP大模型論文：清華大學：大語言模型的常見詞僻意理解能力竟不如中學生

聯(lián)系作者

文章來源：夕小瑤科技說
作者微信：xixiaoyaoQAQ
作者簡介：專業(yè)、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員，覆蓋500多家海內(nèi)外機構投資人，互聯(lián)網(wǎng)大廠中高管和AI公司創(chuàng)始人。一線作者來自清北、國內(nèi)外頂級AI實驗室和大廠，兼?zhèn)涿翡J的行業(yè)嗅覺和洞察深度。商務合作：zym5189

閱讀原文