GPT-4「榮升」AI頂會同行評審專家？斯坦福最新研究：ICLR/NeurIPS等竟有16.9%評審是ChatGPT生成

AIGC動態2年前 (2024)發布新智元

AIGC動態歡迎閱讀

原標題：GPT-4「榮升」AI頂會同行評審專家？斯坦福最新研究：ICLR/NeurIPS等竟有16.9%評審是ChatGPT生成
關鍵字：政策,報告,語料庫,同行,語料
文章來源：新智元
內容字數：3842字

內容摘要：

新智元報道編輯：Mindy
【新智元導讀】斯坦福的一篇案例研究表示，提交給AI會議的同行評審文本中，有6.5%到16.9%可能是由LLM大幅修改的，而這些趨勢可能在個體級別上難以察覺。LLM在飛速進步的同時，人類也越來越難以區分LLM生成的文本與人工編寫的內容，甚至分辨能力與隨機器不相上下。
這加大了未經證實的生成文本可以偽裝成權威、基于證據的寫作的風險。
盡管在個例上難以察覺，但由于LLM的輸出趨于一致性，這種趨勢可能會放大語料庫級別的偏見。
基于這一點，一支來自斯坦福的團隊提出一種方法，以此來對包含不確定量的AI生成文本的真實世界數據集進行可比較的評估，并在AI會議的同行評審文本中驗證。
論文地址：https://arxiv.org/abs/2403.07183
AI會議的同行評審可能是AI？同行評審是一種學術論文發表前的質量評估機制。
這些同行評審者通常具有相關領域的專業知識，他們會對論文的原創性、方法學、數據分析、結果解釋等進行評價，以確保論文的科學性和可信度。
斯坦福團隊研究的AI會議包括ICLR 2024、NeurIPS 2023、CoRL 2023和EMNLP 2023

原文鏈接：GPT-4「榮升」AI頂會同行評審專家？斯坦福最新研究：ICLR/NeurIPS等竟有16.9%評審是ChatGPT生成