震驚！OpenAI“造假”石錘？秘密參與數學基準測試，FrontierMath 透明度遭質疑

AIGC動態8個月前發布人工智能學家

230 0 0

原標題：震驚！OpenAI“造假”石錘？秘密參與數學基準測試，FrontierMath 透明度遭質疑
文章來源：人工智能學家
內容字數：11057字

Epoch AI就FrontierMath項目透明度問題致歉

Epoch AI公司就其與OpenAI合作的FrontierMath項目透明度問題發表聲明，公開道歉并承諾改進未來合作的透明度。

1. 概述

FrontierMath是一個評估前沿數學模型能力的基準測試項目，Epoch AI與OpenAI合作開發。由于溝通和透明度不足，Epoch AI遭到了批評。其聲明承認在與OpenAI合作過程中存在以下錯誤：

2. 主要錯誤

披露時間過晚：由于合同限制，Epoch AI直到FrontierMath第三次迭代發布前后才披露與OpenAI的合作關系。他們承認應該在談判中爭取盡早披露合作信息。
溝通不一致：Epoch AI向部分數學家透露了他們獲得了實驗室資助，但未系統地告知所有參與者，也未明確指出合作的實驗室是OpenAI。
未將透明度作為合作前提：即使受到合同限制，Epoch AI也應該將與貢獻者的透明度作為與OpenAI達成協議的不可協商部分。數學家們有權知道誰可以訪問他們的工作成果。

3. 數據訪問與使用

OpenAI確實可以訪問FrontierMath的大部分問題和解決方案，但有一個未被OpenAI看到的保留集，用于驗證模型能力。雙方有口頭協議，這些材料不會被用于模型訓練。OpenAI的相關員工公開將FrontierMath描述為“強保留”的評估集，這與Epoch AI的理解一致。OpenAI也支持Epoch AI維護一個單獨的、未被看到的保留集，以防止過擬合并確保準確衡量模型的進步。

4. 未來改進

Epoch AI承諾在未來的合作中改進透明度，確保貢獻者在項目開始時就獲得關于資金來源、數據訪問和使用目的的清晰信息。他們將努力在所有可能的方面提高透明度。

5. 總結

此次突顯了在人工智能研究合作中，保持透明度和開放溝通的重要性。Epoch AI的道歉和承諾改進，為未來人工智能項目合作樹立了改進的榜樣，強調了數據安全和研究倫理的重要性。

聯系作者

文章來源：人工智能學家
作者微信：
作者簡介：致力成為權威的人工智能科技媒體和前沿科技研究機構

閱讀原文

# AIGC動態 # AI基準測試透明度 # FrontierMath測試爭議 # OpenAI模型造假質疑 # 人工智能可信度評估 # 大型語言模型數學能力評估

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

震驚！OpenAI“造假”石錘？秘密參與數學基準測試，FrontierMath 透明度遭質疑

Epoch AI就FrontierMath項目透明度問題致歉

1. 概述

2. 主要錯誤

3. 數據訪問與使用

4. 未來改進

5. 總結

聯系作者

首次超越擴散模型和非自回歸Transformer模型！字節開源RAR：自回歸生成最新SOTA！

對話生數科技Vidu產品負責人：100天千萬用戶之后，2025年視頻生成產品會變成怎樣？

相關文章

暫無評論

ChatGPT

玩虛擬模特？

震驚！OpenAI“造假”石錘？ 秘密參與數學基準測試，FrontierMath 透明度遭質疑

Epoch AI就FrontierMath項目透明度問題致歉

1. 概述

2. 主要錯誤

3. 數據訪問與使用

4. 未來改進

5. 總結

聯系作者

首次超越擴散模型和非自回歸Transformer模型！字節開源RAR：自回歸生成最新SOTA！

對話生數科技Vidu產品負責人：100天千萬用戶之后，2025年視頻生成產品會變成怎樣？

相關文章

暫無評論

ChatGPT

玩虛擬模特？

震驚！OpenAI“造假”石錘？秘密參與數學基準測試，FrontierMath 透明度遭質疑