多個(gè)中國(guó)團(tuán)隊(duì)斬獲EMNLP'24最佳論文!UCLA華人學(xué)者中三篇杰出論文,明年頂會(huì)落戶蘇州
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:多個(gè)中國(guó)團(tuán)隊(duì)斬獲EMNLP'24最佳論文!UCLA華人學(xué)者中三篇杰出論文,明年頂會(huì)落戶蘇州
關(guān)鍵字:模型,語(yǔ)言,論文,數(shù)據(jù),方法
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
白小交 西小風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI剛剛,EMNLP 2024最佳論文獎(jiǎng)新鮮出爐!
5篇中榜論文中,華人學(xué)者參與三篇,分別來(lái)自CMU、上海交通大學(xué)、中國(guó)科學(xué)院大學(xué)等機(jī)構(gòu)。
其中,Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method主要由中科院網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)、中國(guó)科學(xué)院大學(xué)的學(xué)者完成。
論文一作Weichao Zhang;通訊作者郭嘉豐,現(xiàn)任中科院網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室常務(wù)副主任。
這項(xiàng)研究提出了一個(gè)新的數(shù)據(jù)集和方法,用于檢測(cè)給定文本是否為L(zhǎng)LM預(yù)訓(xùn)練數(shù)據(jù)的一部分,有助于提高LLM訓(xùn)練數(shù)據(jù)透明度。
EMNLP’24今年收錄論文總共2978篇,比去年增長(zhǎng)5%,其中2455篇主會(huì)議論文,523篇workshop論文。
除最佳論文外,杰出論文也揭曉了,超半數(shù)華人學(xué)者參與。
順便提一嘴,EMNLP 2025將于明年11月5-9日,在中國(guó)蘇州舉辦!
國(guó)內(nèi)學(xué)者們可以搓搓手準(zhǔn)備起來(lái)了~
接下來(lái),具體康康獲獎(jiǎng)?wù)撐挠心男?br />上交大CMU
原文鏈接:多個(gè)中國(guó)團(tuán)隊(duì)斬獲EMNLP'24最佳論文!UCLA華人學(xué)者中三篇杰出論文,明年頂會(huì)落戶蘇州
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介: