「數(shù)據(jù)墻」迫近?蘋果OpenAI等巨頭走投無路,被迫「偷師」YouTube視頻!
AIGC動態(tài)歡迎閱讀
原標(biāo)題:「數(shù)據(jù)墻」迫近?蘋果OpenAI等巨頭走投無路,被迫「偷師」YouTube視頻!
關(guān)鍵字:數(shù)據(jù),創(chuàng)作者,知識產(chǎn)權(quán),侵權(quán),內(nèi)容
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:喬楊 庸庸
【新智元導(dǎo)讀】近日,《連線》雜志聯(lián)合ProofNews聯(lián)合發(fā)表一篇調(diào)查文章,指責(zé)蘋果、Anthropic等科技巨頭未經(jīng)許可使用YouTube視頻訓(xùn)練AI模型。但訓(xùn)練數(shù)據(jù)的使用邊界究竟在哪里?創(chuàng)作者、大公司和開發(fā)者正在陷入知識產(chǎn)權(quán)的羅生門……AI科技巨頭的「數(shù)據(jù)荒」到底該拿什么拯救?
為了訓(xùn)練生成式AI,尤其是在scalling law的支配之下,互聯(lián)網(wǎng)上現(xiàn)存的內(nèi)容早已不能滿足LLM越來越大的胃口,It’s soooo hungry for data!
「數(shù)據(jù)荒」的直接結(jié)果,就是科技巨頭對GenAI的訓(xùn)練數(shù)據(jù)越來越「饑不擇食」。
不僅僅是書籍、文章,甚至Instagram、X、Fackbook等各種社交平臺上的內(nèi)容也是來者不拒。
前段時(shí)間和OpenAI簽合作協(xié)議,而且坑了谷歌搜索、導(dǎo)致Gemini教唆網(wǎng)友給披薩加膠水的Reddit也是其中之一。
為了規(guī)避潛在的法律糾紛,GPT、Gemini、Claude等商業(yè)模型在發(fā)布時(shí)往往選擇對訓(xùn)練數(shù)據(jù)「三緘其口」,絕口不提及其來源、構(gòu)成、使用許可等信息。
然而,這個問題早就引起了創(chuàng)作者和各種媒體平臺越來越強(qiáng)烈的不滿。
近
原文鏈接:「數(shù)據(jù)墻」迫近?蘋果OpenAI等巨頭走投無路,被迫「偷師」YouTube視頻!
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介: