科技巨頭如何為了發(fā)展人工智能而采取捷徑收集數(shù)據(jù)
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:科技巨頭如何為了發(fā)展人工智能而采取捷徑收集數(shù)據(jù)
關(guān)鍵字:政策,數(shù)據(jù),知識(shí)產(chǎn)權(quán),人工智能,模型
文章來源:AI范兒
內(nèi)容字?jǐn)?shù):14566字
內(nèi)容摘要:
點(diǎn)擊上方藍(lán)字關(guān)注我們“科技巨頭正在大規(guī)模收集用戶數(shù)據(jù),用于訓(xùn)練人工智能系統(tǒng)。這些公司利用用戶的網(wǎng)絡(luò)活動(dòng)、位置信息和其他個(gè)人數(shù)據(jù),開發(fā)出更加智能和個(gè)性化的產(chǎn)品。這種做法引發(fā)了隱私和數(shù)據(jù)安全的擔(dān)憂,需要和公眾加強(qiáng)監(jiān)管和保護(hù)措施。到了 2021 年底,OpenAI 面臨數(shù)據(jù)短缺的問題。在開發(fā)最新 AI系統(tǒng)的過程中,他們已經(jīng)耗盡了互聯(lián)網(wǎng)上所有可靠的英文文本資源。為了訓(xùn)練技術(shù)的下一個(gè)版本,他們需要更多的數(shù)據(jù),而且是大量的數(shù)據(jù)。
因此,OpenAI 研究人員創(chuàng)造了 Whisper,這個(gè)工具能夠轉(zhuǎn)錄 YouTube 視頻的音頻,產(chǎn)生新的對話文本,以提升 AI系統(tǒng)的智能水平。
一些知情人士透露,OpenAI 的員工討論過這樣的做法可能會(huì)違反 YouTube 的規(guī)定。YouTube 作為 Google 的一部分,禁止將其視頻用于于該視頻平臺(tái)的應(yīng)用。
最終,OpenAI 團(tuán)隊(duì)轉(zhuǎn)錄了超過一百萬小時(shí)的 YouTube 視頻。據(jù)說,包括 OpenAI 總裁 Greg Brockman 在內(nèi)的小組成員親自參與了視頻的收集工作。這些文本隨后被輸入到名為 GPT-4 的系統(tǒng)中,該系統(tǒng)被廣泛認(rèn)為是全球最強(qiáng)大的
原文鏈接:科技巨頭如何為了發(fā)展人工智能而采取捷徑收集數(shù)據(jù)
聯(lián)系作者
文章來源:AI范兒
作者微信:AI_Insights
作者簡介:AI領(lǐng)域四大媒體之一。 智能未來,始于Prompt!