原標題:谷歌 AlphaChip 論文再被質疑,DeepMind 駁斥都沒做與訓練,順帶還揪出了“內鬼”?
文章來源:人工智能學家
內容字數:23033字
AlphaChip項目的歷程與質疑
2020年,DeepMind推出了AlphaChip,一個能夠生成超越人類能力的深度強化學習芯片布局設計方法,并在《自然》雜志上發表了相關論文。該項目引發了芯片設計領域的廣泛關注和后續研究,然而也面臨了不少質疑。2024年11月,Synopsys的架構師Igor Markov對AlphaChip及其相關研究進行了元分析,提出了多項質疑,尤其集中在Cheng等人對AlphaChip方法的重新實現上。
時間線
1. **2020年4月**:AlphaChip論文的arXiv預印本發布。
2. **2020年8月**:在TPU v5e中流片了由AlphaChip生成的布局。
3. **2021年6月**:論文在《自然》雜志上正式發表。
4. **2021年9月**:在TPU v5p中流片了15種由AlphaChip生成的布局。
5. **2022年1月至7月**:DeepMind開源了AlphaChip,期間另一團隊復現了相關結果。
6. **2022年10月**:在Trillium中流片了25種布局。
7. **2023年6月**:Markov發布了他的“元分析”預印本。
8. **2024年4月**:《自然》雜志完成了對DeepMind成果的調查,并支持其研究結論。
對AlphaChip的質疑
Markov及其團隊的“元分析”提出了多項指控,包括可重復性差、數據污染等。然而DeepMind對此進行了反駁。他們指出,Cheng等人的研究在復現過程中存在多項錯誤,例如未進行預訓練、計算資源不足和未達到模型收斂等。具體問題包括:
1. **未進行預訓練**:Cheng等人未對強化學習方法進行預訓練,導致方法性能大幅下降。
2. **計算資源不足**:使用的計算資源遠低于原始論文要求,影響了結果的有效性。
3. **未訓練至收斂**:模型未達到收斂標準,影響了最終指標的可靠性。
4. **測試用例舊且不具代表性**:所用測試用例基于較舊的制程節點,與DeepMind的現代設計不符。
DeepMind的回應
DeepMind強調其研究方法的開源性和可重復性,提供了完整的開源代碼和數據集供外部驗證。他們指出,Markov的質疑缺乏實證支持,并且在分析中未能遵循標準的機器學習實踐。此外,DeepMind還對Cheng等人的方法與商業布局工具的比較提出了質疑,認為這種比較不具合理性。
總結
AlphaChip項目的推出與發展引發了芯片設計領域的重大關注,同時也面臨了諸多質疑。DeepMind通過開源和透明的方式回應了這些質疑,強調其方法的有效性和可重復性。盡管存在不同的觀點和研究結果,AlphaChip的持續發展和應用表明其在芯片設計中的潛力。
聯系作者
文章來源:人工智能學家
作者微信:
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構