AIGC動態歡迎閱讀
原標題:訓出GPT-5短缺20萬億token!OpenAI被曝計劃建「數據市場」
關鍵字:數據,模型,政策,人工智能,研究人員
文章來源:新智元
內容字數:5506字
內容摘要:
新智元報道編輯:桃子
【新智元導讀】全網高質量數據集告急!OpenAI、Anthropic等AI公司正在開拓新方法,訓練下一代AI模型。全網真的無數據可用了!
外媒報道稱,OpenAl、Anthropic等公司正在努力尋找足夠的信息,來訓練下一代人工智能模型。
前幾天,OpenAI和微軟被曝出正在聯手打造超算「星際之門」,解決算力難題。
然而,數據也是訓練下一代強大模型,最重要的一味丹藥。
面對窮盡互聯網的數據難題,AI初創、互聯網大廠真的坐不住了。
GPT-5訓練,用上了YouTube視頻不論是下一代GPT-5、還是Gemini、Grok等強大系統的開發,都需要從大量的海洋數據中學習。
可以預見的是,互聯網中高質量公共數據已經變得非常稀缺。
與此同時,一些數據所有者,比如Reddit等機構,制定政策阻止AI公司的訪問數據。
一些高管和研究人員稱,由于對高質量文本數據的需求,可能會在2年內超過供應,這可能會減緩人工智能的發展。
也包括2022年11月,就有MIT等研究人員警告,機器學習數據集可能會在2026年之前耗盡所有「高質量語言數據」。
論文地址:https://arxiv.or
原文鏈接:訓出GPT-5短缺20萬億token!OpenAI被曝計劃建「數據市場」
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...