AIGC動態歡迎閱讀
內容摘要:
點擊上方藍字關注我們“隨著AI訓練數據成本的不斷攀升,僅有資金雄厚的科技巨頭如谷歌和Meta能夠承擔。這導致AI發展日益集中化,小型企業和學術機構難以參與競爭。專家擔憂,數據獲取的不平等可能抑制創新,限制AI技術的審查與研究。同時,大型科技公司通過收購版權內容或利用公共數據源,進一步鞏固其在AI領域的領導地位。數據是當代尖端人工智能(AI)系統的靈魂,但其成本日益攀升,使得只有資金最雄厚的科技公司才能負擔得起。
去年,OpenAI的研究員James Betker在其個人博客上發表了一篇文章,討論了生成式AI模型的本質以及它們所訓練的數據集。Betker在文章中提出,訓練數據——而非模型的設計、架構或其他任何特性——是推動AI系統日益復雜和功能強大的關鍵因素。(見文后的“往期推薦”)
“只要在相同數據集上訓練足夠長的時間,幾乎所有模型都會達到相同的水平,”Betker寫道。
Betker的觀點是否正確?訓練數據是否是決定模型能力的最大因素,無論是回答問題、繪制人手還是生成逼真的城市景觀?
這聽起來是合理的。
統計機器生成式AI系統本質上是概率模型——一大堆統計數據。它們根據海量的示例
原文鏈接:AI訓練數據成本高昂,僅剩巨頭玩得起!
聯系作者
文章來源:AI范兒
作者微信:AI_Insights
作者簡介:AI領域四大媒體之一。 智能未來,始于Prompt!
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...