AIGC動態歡迎閱讀
原標題:GPT-4「榮升」AI頂會同行評審專家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%評審是ChatGPT生成
關鍵字:政策,報告,語料庫,同行,語料
文章來源:新智元
內容字數:3842字
內容摘要:
新智元報道編輯:Mindy
【新智元導讀】斯坦福的一篇案例研究表示,提交給AI會議的同行評審文本中,有6.5%到16.9%可能是由LLM大幅修改的,而這些趨勢可能在個體級別上難以察覺。LLM在飛速進步的同時,人類也越來越難以區分LLM生成的文本與人工編寫的內容,甚至分辨能力與隨機器不相上下。
這加大了未經證實的生成文本可以偽裝成權威、基于證據的寫作的風險。
盡管在個例上難以察覺,但由于LLM的輸出趨于一致性,這種趨勢可能會放大語料庫級別的偏見。
基于這一點,一支來自斯坦福的團隊提出一種方法,以此來對包含不確定量的AI生成文本的真實世界數據集進行可比較的評估,并在AI會議的同行評審文本中驗證。
論文地址:https://arxiv.org/abs/2403.07183
AI會議的同行評審可能是AI?同行評審是一種學術論文發表前的質量評估機制。
這些同行評審者通常具有相關領域的專業知識,他們會對論文的原創性、方法學、數據分析、結果解釋等進行評價,以確保論文的科學性和可信度。
斯坦福團隊研究的AI會議包括ICLR 2024、NeurIPS 2023、CoRL 2023和EMNLP 2023
原文鏈接:GPT-4「榮升」AI頂會同行評審專家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%評審是ChatGPT生成
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。