只是少打了一個問號
原標題:DeepSeek V3“報錯家門”:我是ChatGPT
文章來源:量子位
內容字數:3194字
DeepSeek V3:爆火與爭議
近日,大模型DeepSeek V3引發熱議,其低成本(557.6萬美元)訓練和強大的能力成為焦點。然而,一個奇怪的bug也備受關注:缺少問號時,DeepSeek V3會“報錯家門”,自稱ChatGPT,甚至生成與ChatGPT相同的笑話。
“報錯家門”之謎
1. **并非ChatGPT數據訓練?** 盡管有人懷疑DeepSeek V3是在ChatGPT輸出基礎上訓練的,但這一說法缺乏有力證據。許多大模型都接觸過ChatGPT的數據,但這并不意味著DeepSeek V3的性能完全依賴于此。其在Pile測試中的高分也說明,其性能并非完全取決于ChatGPT數據。
2. **AI污染的隱患?** TechCrunch指出,網絡充斥著AI生成的“垃圾數據”,這使得訓練數據難以徹底過濾AI輸出,導致模型出現“報錯家門”的情況。歐盟預測,到2026年,90%的在線內容可能是AI生成的,這進一步加劇了“AI污染”的風險。
3. **成本節約的?** AI Now Institute的首席科學家Heidy Khlaaf認為,開發者被從現有AI模型中“蒸餾”知識帶來的成本節約所吸引,這可能導致意外地使用ChatGPT或GPT-4輸出進行訓練。
DeepSeek V3的強大能力
1. **實用性強:** 盡管存在bug,DeepSeek V3的強大能力獲得廣泛認可。許多用戶分享了其在網站創建、AI視頻編輯和AI編程等領域的實用案例,例如結合Cursor進行貪吃蛇游戲開發。
2. **優于競品:** 在與Claude Sonnet 3.5的對比測試中,DeepSeek V3在Scroll Hub網站創建方面表現更佳。
3. **團隊構成:** DeepSeek V3的論文貢獻列表中,不僅包含技術人員,還包括數據注釋和商務人員,體現了團隊的全面性。
總結
DeepSeek V3的“報錯家門”bug引發了人們對AI數據污染和模型訓練方法的思考。盡管存在這一問題,DeepSeek V3強大的能力和廣泛的應用前景依然值得關注。其低成本訓練也為大模型發展提供了新的思路。未來,如何有效地解決AI數據污染問題,將成為大模型領域面臨的重要挑戰。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破