OpenAI拒絕進一步置評
原標題:硅谷掀桌!DeepSeek遭OpenAI和Anthropic圍剿,美國網友都看不下去了
文章來源:量子位
內容字數:6277字
OpenAI與Anthropic罕見聯手圍剿DeepSeek:模型蒸餾引發的爭議
近日,OpenAI和Anthropic兩家AI巨頭罕見聯手,對開源AI模型公司DeepSeek展開調查,引發行業熱議。起因是OpenAI聲稱DeepSeek利用其模型進行訓練,涉嫌知識產權,具體指控為“模型蒸餾”。
1. OpenAI的指控與行業反應
OpenAI指控DeepSeek通過模型蒸餾技術,利用OpenAI模型的輸出提升自身模型性能,這違反了OpenAI的服務條款。此消息一出,引發業內人士廣泛質疑,認為OpenAI此舉具有諷刺意味,因為OpenAI自身在數據獲取方面也存在合規性問題,曾被《紐約時報》以知識產權為由告上法庭。
2. Anthropic的回應與模型蒸餾技術
Anthropic創始人Dario Amodei則認為DeepSeek的威脅被夸大,其模型水平與Anthropic 7-10個月前的模型相當,只是成本更低。他更關注的是如何保持領先地位,暗示需要設置更多限制。 模型蒸餾本身是一種常見的模型壓縮技術,通過將大型模型的知識“蒸餾”到小型模型,提高效率并降低成本。該技術在學術界和工業界廣泛應用,許多開源模型的服務條款也允許蒸餾。
3. 微軟的耐人尋味之舉
微軟在OpenAI指控DeepSeek后數小時,在其AI平臺接入了DeepSeek模型,此舉耐人尋味,被網友戲稱為“否認是接受的第一步”。微軟員工表示DeepSeek可能在去年秋天調用了OpenAI的API,這可能導致數據泄露。
4. DeepSeek的回應與模型價值
DeepSeek首席科學家Mark Chen回應稱,DeepSeek R1并非簡單蒸餾,其發現了OpenAI在實現o1過程中的一些核心理念,并在成本控制方面取得了顯著成果。OpenAI首席科學家也認可了DeepSeek在成本控制上的工作,并承認模型蒸餾技術的趨勢。
5. DeepSeek R1的意義與行業趨勢
分析師郭明錤認為DeepSeek R1加速了兩個趨勢:一是AI算力優化,在Scaling Law放緩的情況下,通過優化訓練方式持續提升模型效益;二是API/Token價格下滑,加速AI應用多元化。DeepSeek R1的低成本策略將有助于增加AI算力需求,降低投資風險。
6. 總結
OpenAI對DeepSeek的指控引發了關于模型蒸餾技術、數據使用權和AI行業競爭的廣泛討論。盡管模型蒸餾技術本身被廣泛接受,但其在特定服務條款下的應用仍存在爭議。OpenAI自身在數據合規性方面的問題也使其指控的公信力受到質疑。DeepSeek R1的出現則凸顯了AI領域在降低成本和提高效率方面的持續探索。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破