得分 8, 8, 8, 10。
原標題:rebuttal真的有用!這篇ICLR論文,所有審稿人都加了2分,直接躍升排名第9
文章來源:機器之心
內容字數:7336字
ICLR 2025 論文評審與反駁過程分析
最近,ICLR 2025 論文的評審過程引發關注,其中一篇論文通過反駁顯著提升了評分。本文將探討這篇論文的研究內容及其在評審過程中的反駁策略。
1. 論文概述
論文標題為《SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers》,由英偉達、MIT和清華大學的研究團隊合作完成。該論文提出了Sana,一個高效的圖像生成工作流程,支持1024×1024到4096×4096的高分辨率圖像合成。研究顯示,Sana在生成4K圖像時速度比現有最佳模型FLUX快100倍。
2. 關鍵技術創新
Sana的創新點主要體現在以下幾個方面:
(1)深度壓縮自動編碼器:提出了一種新的自動編碼器(AE),將縮放因子提升至32,顯著提高了高分辨率圖像生成的效率。
(2)高效線性DiT:用線性注意力替代原生的二次注意力模塊,計算復雜度從O(N2)降低到O(N)。
(3)文本編碼器的選擇:使用最新的Gemma模型作為文本編碼器,以增強對用戶指令的理解和推理能力。
(4)有效的訓練策略:提出了基于Clip Score的訓練策略和Flow-DPM-Solver,提升了文本與圖像的一致性。
3. 反駁過程及其成效
在評審過程中,作者針對審稿人的意見進行了詳細的反駁。審稿人對Sana的原創性表示懷疑,認為其組件已有相關研究。作者通過詳細闡述Sana的設計思路和實驗結果,成功說服了審稿人,提升了評分。
具體來說,作者補充了消融實驗,展示了Sana在各個方面的創新與進步。一位審稿人在審閱后表示,經過作者的詳細回應,已無法找到明顯的缺點,因此提升了評分。
4. 結論
這一案例表明,建設性的討論和細致的反饋能夠顯著改善審稿人對論文的看法。積極的互動不僅提高了論文質量,也增強了審稿人與作者之間的理解與信任。這一過程為其他研究者提供了寶貴的經驗,強調了反駁在論文評審中的重要性。
聯系作者
文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺