開(kāi)源大模型 DeepSeek 到底開(kāi)放了什么?
六問(wèn) DeepSeek!
原標(biāo)題:開(kāi)源大模型 DeepSeek 到底開(kāi)放了什么?
文章來(lái)源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):11038字
DeepSeek開(kāi)源大模型深度解析:開(kāi)放程度、許可證及合規(guī)性
本文深入探討了DeepSeek開(kāi)源大模型的開(kāi)源程度、許可證類型及其合規(guī)性問(wèn)題。DeepSeek作為一款性能媲美閉源大模型的開(kāi)源項(xiàng)目,其開(kāi)源策略備受關(guān)注。
1. DeepSeek的性能與版本迭代
DeepSeek經(jīng)歷了V2、V2.5、V3、R1-Zero、R1等多個(gè)版本迭代。其中,V3版本在多個(gè)基準(zhǔn)測(cè)試中展現(xiàn)出優(yōu)異性能,甚至與領(lǐng)先的閉源模型相媲美。R1版本則通過(guò)強(qiáng)化學(xué)習(xí)而非監(jiān)督微調(diào)提升了模型能力,在部分測(cè)試項(xiàng)中超越了OpenAI的o1模型。
2. DeepSeek的開(kāi)源許可證
DeepSeek在Hugging Face平臺(tái)上開(kāi)放了68個(gè)模型和一個(gè)數(shù)據(jù)集。其中,DeepSeek-R1和DeepSeek-R1-Zero模型采用MIT許可證,其余模型則采用DeepSeek許可證(代碼部分仍為MIT許可證)。此外,DeepSeek還基于Qwen和Llama模型蒸餾出6個(gè)模型,其許可證分別為MIT、Apache 2.0和Llama許可證。
3. DeepSeek的開(kāi)放層級(jí)
根據(jù)LF AI&Data基金會(huì)的模型開(kāi)放框架(MOF),DeepSeek的開(kāi)放層級(jí)尚未達(dá)到最高級(jí)別。DeepSeek開(kāi)放了模型架構(gòu)、模型卡、模型參數(shù)、技術(shù)報(bào)告和評(píng)估結(jié)果等,但并未開(kāi)放訓(xùn)練代碼、推理代碼、評(píng)估代碼和數(shù)據(jù)集等關(guān)鍵組件。
4. DeepSeek的使用和分發(fā)限制
除R1系列模型外,其他DeepSeek模型受DeepSeek許可證約束,該許可證基于負(fù)責(zé)任人工智能許可證(RAIL)設(shè)計(jì),包含諸多使用限制,例如禁止用于軍事用途、生成虛假信息、歧視特定群體等。而MIT許可證下的R1模型則沒(méi)有這些限制。值得注意的是,DeepSeek許可證中明確指出數(shù)據(jù)未獲得許可。
5. DeepSeek的知識(shí)產(chǎn)權(quán)許可
DeepSeek許可證授予用戶永久、全球、非排他、免費(fèi)、免版稅、不可撤銷的版權(quán)和專利許可(專利許可存在例外情況)。這些條款與常見(jiàn)的Apache 2.0許可證類似。
6. DeepSeek模型的分發(fā)條件
分發(fā)DeepSeek模型需遵守多項(xiàng)條件,包括將使用限制納入法律協(xié)議、提供DeepSeek許可證副本、保留版權(quán)聲明等。未遵守這些條件將構(gòu)成違約或侵權(quán)。
7. 蒸餾模型的額外限制
使用DeepSeek基于Qwen和Llama蒸餾的模型,除了需滿足MIT許可證外,還需遵守Qwen的Apache 2.0許可證和Llama許可證,后者包含商業(yè)使用限制。
8. DeepSeek的合規(guī)性問(wèn)題
DeepSeek自身可能并未完全遵守其引用的開(kāi)源許可證,例如未在所有模型分發(fā)材料中附帶許可證副本,未充分履行署名義務(wù)等。這并不意味著使用者可以忽視許可證要求,反而更應(yīng)嚴(yán)格遵守,以促進(jìn)負(fù)責(zé)任的人工智能發(fā)展。
總而言之,DeepSeek的開(kāi)源策略是復(fù)雜且多面的。雖然其模型性能出色,但其開(kāi)源程度和許可證合規(guī)性仍需進(jìn)一步完善。使用者和分發(fā)者都應(yīng)認(rèn)真理解并遵守相關(guān)許可證條款,共同構(gòu)建負(fù)責(zé)任的人工智能生態(tài)。
聯(lián)系作者
文章來(lái)源:人工智能學(xué)家
作者微信:
作者簡(jiǎn)介:致力成為權(quán)威的人工智能科技媒體和前沿科技研究機(jī)構(gòu)