DeepSeek創始人專訪:中國的AI不可能永遠跟隨,需要有人站到技術的前沿
一家隱形AI巨頭的大模型之路。
原標題:DeepSeek創始人專訪:中國的AI不可能永遠跟隨,需要有人站到技術的前沿
文章來源:Founder Park
內容字數:23366字
DeepSeek:中國大模型領域的“異類”
本文講述了DeepSeek這家中國AI公司,如何在激烈的市場競爭中另辟蹊徑,以其獨特的開源路線和對原創創新的堅持,迅速崛起并獲得國際關注的故事。
價格戰的意外參與者
DeepSeek V2的發布意外引發了中國大模型領域的價格戰,并非DeepSeek有意為之,而是其基于成本的合理定價策略,觸發了大廠的跟進。DeepSeek強調其降價并非為了搶占用戶,而是為了推動AI普惠化,以及其在模型結構創新上降低了成本。
原創創新,而非簡單模仿
DeepSeek選擇從模型結構入手進行創新,而非簡單復制Llama模型,這與國內大部分公司選擇快速商業化的路徑截然不同。DeepSeek認為,中國AI應逐步成為全球創新的貢獻者,而非僅僅是應用的跟隨者,而這種選擇在中國語境下顯得尤為“奢侈”。
護城河在于團隊和文化
DeepSeek選擇開源其模型,其護城河并非依靠閉源技術,而是其在團隊建設和企業文化上的積累。通過開源、發表論文,DeepSeek積累了寶貴的經驗和人才,并形成了獨特的創新文化,吸引了更多人才加入。
量化基金的AGI探索
DeepSeek母公司幻方是一家量化基金,其研發大模型并非為了直接服務于金融業務,而是為了探索通用人工智能(AGI)。DeepSeek專注于AGI基礎研究,暫不考慮商業化應用,并擁有充足的研發預算支持其長期投入。
萬卡儲備源于對AI能力邊界的探索
DeepSeek早在2021年就儲備了萬張A100顯卡,這并非基于商業邏輯的預判,而是源于團隊對AI能力邊界的好奇心驅使。DeepSeek認為對算力的渴求是研究人員的本能,而大規模實驗才能推動技術突破。
本土人才成就DeepSeek V2
DeepSeek V2模型的研發團隊全部由中國本土人才組成,這體現了DeepSeek對培養本土人才的信心。團隊的創新也源于自下而上的探索,而非自上而下的指令,這與DeepSeek靈活的組織架構密不可分。
長期主義與開源的堅持
DeepSeek堅持開源路線,并專注于基礎模型研究,暫不考慮閉源或商業化應用。他們認為,建立強大的技術生態比短期利益更重要,并希望更多人能夠低成本地使用大模型技術。
好奇心驅動的瘋狂
DeepSeek的成功源于團隊對AI技術的好奇心和對創新的熱情。這種“瘋狂”的投入和堅持,并非單純的商業行為,而是對技術理想的追求。DeepSeek相信,只有持續的投入和探索,才能推動AGI的實現。
總而言之,DeepSeek的故事展現了中國AI領域一種另類的發展模式,即堅持原創創新,不盲目追求商業化,以長期主義的視角投入基礎研究,最終在國際舞臺上獲得認可。這對于中國AI行業的發展,具有重要的啟示意義。
聯系作者
文章來源:Founder Park
作者微信:
作者簡介:來自極客公園,專注與科技創業者聊「真問題」。