科研評(píng)審的舞臺(tái):當(dāng)春晚遇上學(xué)術(shù)審稿
ICLR25吐槽大賞
原標(biāo)題:ICLR審稿集體搞抽象!評(píng)審結(jié)果寫(xiě)半句,還有的求ta也不審,網(wǎng)友:科研人自己的春晚
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):6232字
ICLR 2025討論階段總結(jié)
今天,ICLR 2025的討論階段已結(jié)束,回顧過(guò)去14天的討論,確實(shí)充滿了戲劇性。許多作者在社交媒體上表達(dá)了對(duì)評(píng)審過(guò)程的無(wú)奈,甚至出現(xiàn)了一些奇葩的評(píng)審現(xiàn)象。
評(píng)審質(zhì)量引發(fā)爭(zhēng)議
例如,UCSB的博士生Jiachen Li提到他收到的評(píng)審內(nèi)容讓人擔(dān)憂,有評(píng)審甚至沒(méi)有說(shuō)完就結(jié)束了。ICLR 2025的論文提交數(shù)量達(dá)到了11000篇,創(chuàng)下新高,為了提高審稿質(zhì)量,會(huì)議引入了多個(gè)AI大模型作為評(píng)審助手。然而,這并沒(méi)有解決所有問(wèn)題。
評(píng)分體系的異常現(xiàn)象
今年ICLR出現(xiàn)了一篇由四位審稿人同時(shí)打出10分的論文,而反觀一些其他論文,則有審稿人給出全1分的極端評(píng)分。比如,某篇論文的審稿人質(zhì)疑其寫(xiě)作質(zhì)量,甚至詢問(wèn)是否由人類作者撰寫(xiě)。作者對(duì)此進(jìn)行了詳細(xì)的反駁,但仍遭遇了評(píng)審的冷處理。
審稿人回應(yīng)的缺失
在討論階段,許多作者發(fā)現(xiàn)他們的審稿人對(duì)問(wèn)題的回復(fù)非常緩慢,甚至有些審稿人完全沒(méi)有回應(yīng),這讓作者們感到失望和無(wú)奈。ICLR的討論階段本應(yīng)是一個(gè)積極互動(dòng)的平臺(tái),但卻變得像是在乞討一般,作者們不得不頻繁催促審稿人。
審稿數(shù)量與質(zhì)量的矛盾
面對(duì)如此龐大的提交數(shù)量,ICLR的審稿人數(shù)量也隨之增加,但并不是所有審稿人都能勝任這一角色。許多參與者認(rèn)為,審稿質(zhì)量的下降與審稿人數(shù)量的激增密切相關(guān)。此外,ICLR2025的接收率和評(píng)分標(biāo)準(zhǔn)也引發(fā)了不少討論,許多人擔(dān)心這將影響整個(gè)AI研究領(lǐng)域的評(píng)估系統(tǒng)。
未來(lái)展望
面對(duì)這些挑戰(zhàn),一些參與者期待未來(lái)能出現(xiàn)更為強(qiáng)大的AI模型,能夠有效地輔助審稿工作,提升評(píng)審質(zhì)量。然而,目前尚不清楚何時(shí)能實(shí)現(xiàn)這一目標(biāo)。
總的來(lái)說(shuō),ICLR 2025的討論階段反映了當(dāng)前學(xué)術(shù)界在高量提交與評(píng)審質(zhì)量之間的矛盾,值得大家深思。
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破