「數(shù)據(jù)墻」迫近?蘋(píng)果OpenAI等巨頭走投無(wú)路,被迫「偷師」YouTube視頻!
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:「數(shù)據(jù)墻」迫近?蘋(píng)果OpenAI等巨頭走投無(wú)路,被迫「偷師」YouTube視頻!
關(guān)鍵字:數(shù)據(jù),創(chuàng)作者,知識(shí)產(chǎn)權(quán),侵權(quán),內(nèi)容
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:?jiǎn)虠?庸庸
【新智元導(dǎo)讀】近日,《連線》雜志聯(lián)合ProofNews聯(lián)合發(fā)表一篇調(diào)查文章,指責(zé)蘋(píng)果、Anthropic等科技巨頭未經(jīng)許可使用YouTube視頻訓(xùn)練AI模型。但訓(xùn)練數(shù)據(jù)的使用邊界究竟在哪里?創(chuàng)作者、大公司和開(kāi)發(fā)者正在陷入知識(shí)產(chǎn)權(quán)的羅生門……AI科技巨頭的「數(shù)據(jù)荒」到底該拿什么拯救?
為了訓(xùn)練生成式AI,尤其是在scalling law的支配之下,互聯(lián)網(wǎng)上現(xiàn)存的內(nèi)容早已不能滿足LLM越來(lái)越大的胃口,It’s soooo hungry for data!
「數(shù)據(jù)荒」的直接結(jié)果,就是科技巨頭對(duì)GenAI的訓(xùn)練數(shù)據(jù)越來(lái)越「饑不擇食」。
不僅僅是書(shū)籍、文章,甚至Instagram、X、Fackbook等各種社交平臺(tái)上的內(nèi)容也是來(lái)者不拒。
前段時(shí)間和OpenAI簽合作協(xié)議,而且坑了谷歌搜索、導(dǎo)致Gemini教唆網(wǎng)友給披薩加膠水的Reddit也是其中之一。
為了規(guī)避潛在的法律糾紛,GPT、Gemini、Claude等商業(yè)模型在發(fā)布時(shí)往往選擇對(duì)訓(xùn)練數(shù)據(jù)「三緘其口」,絕口不提及其來(lái)源、構(gòu)成、使用許可等信息。
然而,這個(gè)問(wèn)題早就引起了創(chuàng)作者和各種媒體平臺(tái)越來(lái)越強(qiáng)烈的不滿。
近
原文鏈接:「數(shù)據(jù)墻」迫近?蘋(píng)果OpenAI等巨頭走投無(wú)路,被迫「偷師」YouTube視頻!
聯(lián)系作者
文章來(lái)源:新智元
作者微信:
作者簡(jiǎn)介: