DeepSeek V3“報(bào)錯(cuò)家門(mén)”:我是ChatGPT
只是少打了一個(gè)問(wèn)號(hào)
原標(biāo)題:DeepSeek V3“報(bào)錯(cuò)家門(mén)”:我是ChatGPT
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):3194字
DeepSeek V3:爆火與爭(zhēng)議
近日,大模型DeepSeek V3引發(fā)熱議,其低成本(557.6萬(wàn)美元)訓(xùn)練和強(qiáng)大的能力成為焦點(diǎn)。然而,一個(gè)奇怪的bug也備受關(guān)注:缺少問(wèn)號(hào)時(shí),DeepSeek V3會(huì)“報(bào)錯(cuò)家門(mén)”,自稱ChatGPT,甚至生成與ChatGPT相同的笑話。
“報(bào)錯(cuò)家門(mén)”之謎
1. **并非ChatGPT數(shù)據(jù)訓(xùn)練?** 盡管有人懷疑DeepSeek V3是在ChatGPT輸出基礎(chǔ)上訓(xùn)練的,但這一說(shuō)法缺乏有力證據(jù)。許多大模型都接觸過(guò)ChatGPT的數(shù)據(jù),但這并不意味著DeepSeek V3的性能完全依賴于此。其在Pile測(cè)試中的高分也說(shuō)明,其性能并非完全取決于ChatGPT數(shù)據(jù)。
2. **AI污染的隱患?** TechCrunch指出,網(wǎng)絡(luò)充斥著AI生成的“垃圾數(shù)據(jù)”,這使得訓(xùn)練數(shù)據(jù)難以徹底過(guò)濾AI輸出,導(dǎo)致模型出現(xiàn)“報(bào)錯(cuò)家門(mén)”的情況。歐盟預(yù)測(cè),到2026年,90%的在線內(nèi)容可能是AI生成的,這進(jìn)一步加劇了“AI污染”的風(fēng)險(xiǎn)。
3. **成本節(jié)約的?** AI Now Institute的首席科學(xué)家Heidy Khlaaf認(rèn)為,開(kāi)發(fā)者被從現(xiàn)有AI模型中“蒸餾”知識(shí)帶來(lái)的成本節(jié)約所吸引,這可能導(dǎo)致意外地使用ChatGPT或GPT-4輸出進(jìn)行訓(xùn)練。
DeepSeek V3的強(qiáng)大能力
1. **實(shí)用性強(qiáng):** 盡管存在bug,DeepSeek V3的強(qiáng)大能力獲得廣泛認(rèn)可。許多用戶分享了其在網(wǎng)站創(chuàng)建、AI視頻編輯和AI編程等領(lǐng)域的實(shí)用案例,例如結(jié)合Cursor進(jìn)行貪吃蛇游戲開(kāi)發(fā)。
2. **優(yōu)于競(jìng)品:** 在與Claude Sonnet 3.5的對(duì)比測(cè)試中,DeepSeek V3在Scroll Hub網(wǎng)站創(chuàng)建方面表現(xiàn)更佳。
3. **團(tuán)隊(duì)構(gòu)成:** DeepSeek V3的論文貢獻(xiàn)列表中,不僅包含技術(shù)人員,還包括數(shù)據(jù)注釋和商務(wù)人員,體現(xiàn)了團(tuán)隊(duì)的全面性。
總結(jié)
DeepSeek V3的“報(bào)錯(cuò)家門(mén)”bug引發(fā)了人們對(duì)AI數(shù)據(jù)污染和模型訓(xùn)練方法的思考。盡管存在這一問(wèn)題,DeepSeek V3強(qiáng)大的能力和廣泛的應(yīng)用前景依然值得關(guān)注。其低成本訓(xùn)練也為大模型發(fā)展提供了新的思路。未來(lái),如何有效地解決AI數(shù)據(jù)污染問(wèn)題,將成為大模型領(lǐng)域面臨的重要挑戰(zhàn)。
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破