今日arXiv最熱NLP大模型論文:GPT-4理解武林外傳中的含蓄表述,達(dá)人類(lèi)水平

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:今日arXiv最熱NLP大模型論文:GPT-4理解武林外傳中的含蓄表述,達(dá)人類(lèi)水平
關(guān)鍵字:模型,解讀,準(zhǔn)則,中文,任務(wù)
文章來(lái)源:夕小瑤科技說(shuō)
內(nèi)容字?jǐn)?shù):7624字
內(nèi)容摘要:
夕小瑤科技說(shuō) 原創(chuàng)作者 | 謝年年在人際交談中,特別是在使用中文這樣博大精深的語(yǔ)言時(shí),人們往往不會(huì)直接回答問(wèn)題,而是采用含蓄、隱晦或間接的表達(dá)方式。
人類(lèi)根據(jù)以往的經(jīng)驗(yàn)或是對(duì)說(shuō)話(huà)者的了解可以對(duì)一些言外之意做出準(zhǔn)確的判斷,比如我們小時(shí)候經(jīng)歷過(guò)無(wú)數(shù)次的對(duì)話(huà)情景:
“媽媽?zhuān)业臅?shū)放哪啦?”
“在我手上,來(lái)拿嘛!”
又或是:
“媽媽?zhuān)裉煳蚁氤约t燒肉可以嗎?”
“你看我像不像紅燒肉。”
面對(duì)媽媽給出的看似回答了又什么都沒(méi)有說(shuō)的回應(yīng),我們能迅速get到媽媽不想搭理我們的心情。那LLMs在面對(duì)類(lèi)似的會(huì)話(huà)隱喻(conversational implicature)時(shí)能理解到說(shuō)話(huà)人真正的含義嗎?
上交最近從經(jīng)典情景喜劇《武林外傳》中提取出首個(gè)針對(duì)會(huì)話(huà)隱喻的中文多輪對(duì)話(huà)數(shù)據(jù)集,挑選出200個(gè)精心設(shè)計(jì)的符合會(huì)話(huà)隱喻的問(wèn)題,并對(duì)八個(gè)LLMs進(jìn)行了多項(xiàng)選擇題任務(wù)和隱喻解釋兩項(xiàng)任務(wù)的測(cè)試。結(jié)果顯示會(huì)話(huà)隱喻這一任務(wù)對(duì)LLMs來(lái)說(shuō)仍然充滿(mǎn)挑戰(zhàn)。
論文標(biāo)題:Do Large Language Models Understand Conversational Implicature –
A case study wit
原文鏈接:今日arXiv最熱NLP大模型論文:GPT-4理解武林外傳中的含蓄表述,達(dá)人類(lèi)水平
聯(lián)系作者
文章來(lái)源:夕小瑤科技說(shuō)
作者微信:xixiaoyaoQAQ
作者簡(jiǎn)介:專(zhuān)業(yè)、有趣、深度價(jià)值導(dǎo)向的科技媒體。聚集30萬(wàn)AI工程師、研究員,覆蓋500多家海內(nèi)外機(jī)構(gòu)投資人,互聯(lián)網(wǎng)大廠中高管和AI公司創(chuàng)始人。一線(xiàn)作者來(lái)自清北、國(guó)內(nèi)外頂級(jí)AI實(shí)驗(yàn)室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺(jué)和洞察深度。商務(wù)合作:zym5189

粵公網(wǎng)安備 44011502001135號(hào)