硅谷掀桌!DeepSeek遭OpenAI和Anthropic圍剿,美國(guó)網(wǎng)友都看不下去了
OpenAI拒絕進(jìn)一步置評(píng)
原標(biāo)題:硅谷掀桌!DeepSeek遭OpenAI和Anthropic圍剿,美國(guó)網(wǎng)友都看不下去了
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):6277字
OpenAI與Anthropic罕見(jiàn)聯(lián)手圍剿DeepSeek:模型蒸餾引發(fā)的爭(zhēng)議
近日,OpenAI和Anthropic兩家AI巨頭罕見(jiàn)聯(lián)手,對(duì)開源AI模型公司DeepSeek展開調(diào)查,引發(fā)行業(yè)熱議。起因是OpenAI聲稱DeepSeek利用其模型進(jìn)行訓(xùn)練,涉嫌知識(shí)產(chǎn)權(quán),具體指控為“模型蒸餾”。
1. OpenAI的指控與行業(yè)反應(yīng)
OpenAI指控DeepSeek通過(guò)模型蒸餾技術(shù),利用OpenAI模型的輸出提升自身模型性能,這違反了OpenAI的服務(wù)條款。此消息一出,引發(fā)業(yè)內(nèi)人士廣泛質(zhì)疑,認(rèn)為OpenAI此舉具有諷刺意味,因?yàn)镺penAI自身在數(shù)據(jù)獲取方面也存在合規(guī)性問(wèn)題,曾被《紐約時(shí)報(bào)》以知識(shí)產(chǎn)權(quán)為由告上法庭。
2. Anthropic的回應(yīng)與模型蒸餾技術(shù)
Anthropic創(chuàng)始人Dario Amodei則認(rèn)為DeepSeek的威脅被夸大,其模型水平與Anthropic 7-10個(gè)月前的模型相當(dāng),只是成本更低。他更關(guān)注的是如何保持領(lǐng)先地位,暗示需要設(shè)置更多限制。 模型蒸餾本身是一種常見(jiàn)的模型壓縮技術(shù),通過(guò)將大型模型的知識(shí)“蒸餾”到小型模型,提高效率并降低成本。該技術(shù)在學(xué)術(shù)界和工業(yè)界廣泛應(yīng)用,許多開源模型的服務(wù)條款也允許蒸餾。
3. 微軟的耐人尋味之舉
微軟在OpenAI指控DeepSeek后數(shù)小時(shí),在其AI平臺(tái)接入了DeepSeek模型,此舉耐人尋味,被網(wǎng)友戲稱為“否認(rèn)是接受的第一步”。微軟員工表示DeepSeek可能在去年秋天調(diào)用了OpenAI的API,這可能導(dǎo)致數(shù)據(jù)泄露。
4. DeepSeek的回應(yīng)與模型價(jià)值
DeepSeek首席科學(xué)家Mark Chen回應(yīng)稱,DeepSeek R1并非簡(jiǎn)單蒸餾,其發(fā)現(xiàn)了OpenAI在實(shí)現(xiàn)o1過(guò)程中的一些核心理念,并在成本控制方面取得了顯著成果。OpenAI首席科學(xué)家也認(rèn)可了DeepSeek在成本控制上的工作,并承認(rèn)模型蒸餾技術(shù)的趨勢(shì)。
5. DeepSeek R1的意義與行業(yè)趨勢(shì)
分析師郭明錤認(rèn)為DeepSeek R1加速了兩個(gè)趨勢(shì):一是AI算力優(yōu)化,在Scaling Law放緩的情況下,通過(guò)優(yōu)化訓(xùn)練方式持續(xù)提升模型效益;二是API/Token價(jià)格下滑,加速AI應(yīng)用多元化。DeepSeek R1的低成本策略將有助于增加AI算力需求,降低投資風(fēng)險(xiǎn)。
6. 總結(jié)
OpenAI對(duì)DeepSeek的指控引發(fā)了關(guān)于模型蒸餾技術(shù)、數(shù)據(jù)使用權(quán)和AI行業(yè)競(jìng)爭(zhēng)的廣泛討論。盡管模型蒸餾技術(shù)本身被廣泛接受,但其在特定服務(wù)條款下的應(yīng)用仍存在爭(zhēng)議。OpenAI自身在數(shù)據(jù)合規(guī)性方面的問(wèn)題也使其指控的公信力受到質(zhì)疑。DeepSeek R1的出現(xiàn)則凸顯了AI領(lǐng)域在降低成本和提高效率方面的持續(xù)探索。
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破