官方承認給數據但否認OpenAI作弊
原標題:o3數學成績作弊大瓜!提前讓測試機構給真題,60多名數學大牛全被蒙在鼓里
文章來源:量子位
內容字數:3745字
OpenAI的o3模型:數學成績造假
近日,OpenAI的全新模型o3在數學能力測試中表現優異,引發廣泛關注。然而,這一成績卻伴隨著巨大的爭議,其背后隱藏著OpenAI與數學基準測試機構Epoch.ai之間的秘密協議。
1. 秘密贊助與提前獲取題目:Epoch.ai開發的FrontierMath數學測試基準,由包括陶哲軒在內的60多位數學家共同設計,題目難度極高。然而,OpenAI在o3發布前就獲得了該基準的經費贊助,并提前獲取了測試題目,而參與出題的數學家們對此毫不知情,直到o3發布后才從公開信息中得知此事。
2. 保密協議的諷刺:FrontierMath的題目和答案均被嚴格保密,參與者需簽署保密協議,甚至禁止使用協同工具進行交流。然而,OpenAI卻能提前獲得這些題目,這與保密協議形成了鮮明對比,也引發了人們對數據安全和學術誠信的質疑。
3. Epoch.ai的回應與爭議:Epoch.ai聯合創始人Tamay Besiroglu承認了秘密贊助和OpenAI提前獲取題目的事實,但否認OpenAI作弊,聲稱OpenAI只獲得部分數據,并口頭承諾不會用于模型訓練。這一回應并未消除質疑,許多人認為僅憑口頭承諾不足以保證數據不被濫用,并質疑OpenAI獲取訪問權限的目的。
4. 專家們的擔憂與后續:多位專家證實了OpenAI提前獲取題目的事實,并表達了擔憂。斯坦福博士Carina Hong表示,部分專家如果事先知道OpenAI的獨家訪問權,可能不會選擇參與出題。Epoch.ai首席數學家Ellot Glazer承諾未來將公開資助信息,并表示相信OpenAI的報告準確性,認為OpenAI沒有作弊的動機。然而,這一說法也引發了網友的質疑。
5. o3模型的真實能力成謎:目前,o3模型的真實能力仍然是一個謎團。其在FrontierMath上的高分成績,在缺乏透明度和信任的情況下,其可靠性受到了極大的挑戰。o3是否名副其實,還有待進一步驗證。
6. 后續發展:OpenAI方面尚未對此事進行回應,Epoch.ai則承諾開發新的保留數據集,以防止類似再次發生。整個暴露了AI模型評估過程中的透明度和數據安全問題,也引發了人們對AI發展倫理的思考。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破