DeepMind再回應AlphaChip質疑，揭秘“內鬼”背后的！

DeepMind再回應AlphaChip質疑，揭秘“內鬼”背后的真相！

原標題：谷歌 AlphaChip 論文再被質疑，DeepMind 駁斥都沒做與訓練，順帶還揪出了“內鬼”？
文章來源：人工智能學家
內容字數：23033字

AlphaChip項目的歷程與質疑

2020年，DeepMind推出了AlphaChip，一個能夠生成超越人類能力的深度強化學習芯片布局設計方法，并在《自然》雜志上發表了相關論文。該項目引發了芯片設計領域的廣泛關注和后續研究，然而也面臨了不少質疑。2024年11月，Synopsys的架構師Igor Markov對AlphaChip及其相關研究進行了元分析，提出了多項質疑，尤其集中在Cheng等人對AlphaChip方法的重新實現上。

時間線

1. **2020年4月**：AlphaChip論文的arXiv預印本發布。
2. **2020年8月**：在TPU v5e中流片了由AlphaChip生成的布局。
3. **2021年6月**：論文在《自然》雜志上正式發表。
4. **2021年9月**：在TPU v5p中流片了15種由AlphaChip生成的布局。
5. **2022年1月至7月**：DeepMind開源了AlphaChip，期間另一團隊復現了相關結果。
6. **2022年10月**：在Trillium中流片了25種布局。
7. **2023年6月**：Markov發布了他的“元分析”預印本。
8. **2024年4月**：《自然》雜志完成了對DeepMind成果的調查，并支持其研究結論。

對AlphaChip的質疑

Markov及其團隊的“元分析”提出了多項指控，包括可重復性差、數據污染等。然而DeepMind對此進行了反駁。他們指出，Cheng等人的研究在復現過程中存在多項錯誤，例如未進行預訓練、計算資源不足和未達到模型收斂等。具體問題包括：

1. **未進行預訓練**：Cheng等人未對強化學習方法進行預訓練，導致方法性能大幅下降。
2. **計算資源不足**：使用的計算資源遠低于原始論文要求，影響了結果的有效性。
3. **未訓練至收斂**：模型未達到收斂標準，影響了最終指標的可靠性。
4. **測試用例舊且不具代表性**：所用測試用例基于較舊的制程節點，與DeepMind的現代設計不符。

DeepMind的回應

DeepMind強調其研究方法的開源性和可重復性，提供了完整的開源代碼和數據集供外部驗證。他們指出，Markov的質疑缺乏實證支持，并且在分析中未能遵循標準的機器學習實踐。此外，DeepMind還對Cheng等人的方法與商業布局工具的比較提出了質疑，認為這種比較不具合理性。

總結

AlphaChip項目的推出與發展引發了芯片設計領域的重大關注，同時也面臨了諸多質疑。DeepMind通過開源和透明的方式回應了這些質疑，強調其方法的有效性和可重復性。盡管存在不同的觀點和研究結果，AlphaChip的持續發展和應用表明其在芯片設計中的潛力。

聯系作者

文章來源：人工智能學家
作者微信：
作者簡介：致力成為權威的人工智能科技媒體和前沿科技研究機構

閱讀原文

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

DeepMind再回應AlphaChip質疑，揭秘“內鬼”背后的！

AlphaChip項目的歷程與質疑

時間線

對AlphaChip的質疑

DeepMind的回應

總結

聯系作者

谷歌 AlphaChip 論文再被質疑，DeepMind 駁斥都沒做與訓練，順帶還揪出了“內鬼”？

探索LLM與擴散模型的結合：未來多模態大模型的無限可能性

相關文章

暫無評論

ChatGPT

畢業論文生成器

AIGC熱點