一群頂尖搜索人才如何2個月出貨，還把GPU利用率干到60%！揭秘百川智能研發(fā)大模型這一年

AIGC動態(tài)1年前 (2024)發(fā)布 AI前線

AIGC動態(tài)歡迎閱讀

原標(biāo)題：一群頂尖搜索人才如何2個月出貨，還把GPU利用率干到60%！揭秘百川智能研發(fā)大模型這一年
關(guān)鍵字：模型,騰訊,華為,快手,能力
文章來源：AI前線
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

作者｜褚杏娟采訪嘉賓｜陳煒鵬
去年的大模型之戰(zhàn)講究一個“快”字：入場快、發(fā)布快、迭代快。
王小川在去年 4 月份宣布成立“百川智能”的兩個月后，就迅速對外推出了 70 億參數(shù)量的中英文預(yù)訓(xùn)練大模型 Baichuan 7B。一年多后的今天，百川智能已經(jīng)將大模型迭代到了 Baichuan 4。
曾擔(dān)任搜狗搜索研發(fā)總經(jīng)理的陳煒鵬如今在百川智能負(fù)責(zé)模型研發(fā)，這對他來講也是一次挑戰(zhàn)?！八阉髋c模型研發(fā)有很大的不同，研發(fā)經(jīng)驗不一定能完全復(fù)刻，比如兩者對數(shù)據(jù)的定義可能完全不一樣?！?br />但陳煒鵬也表示，做搜索和大模型也有共性，就是它們都是系統(tǒng)性工程。“在大模型之前，被認(rèn)為系統(tǒng)性工程的算法問題只有三個：搜索系統(tǒng)、推薦系統(tǒng)和廣告系統(tǒng)。以前的搜索經(jīng)驗讓我知道怎么樣解決一個系統(tǒng)性的問題?！?br />實際上，百川智能的技術(shù)團(tuán)隊可以分為兩部分：一部分是像陳煒鵬這樣有很強(qiáng)系統(tǒng)性工程經(jīng)驗的人，他們做過復(fù)雜的項目，知道怎樣把復(fù)雜的問題拆解成為子問題，然后做有效的科學(xué)管理；另一部分則是對語言模型本身有很好認(rèn)知的研發(fā)人員。
“大模型的研發(fā)不是一個單點問題，而是一個系統(tǒng)問題。解決系統(tǒng)性問題，是我們團(tuán)隊的優(yōu)勢?！标悷橓i說道。那百川智能（

原文鏈接：一群頂尖搜索人才如何2個月出貨，還把GPU利用率干到60%！揭秘百川智能研發(fā)大模型這一年

聯(lián)系作者

文章來源：AI前線
作者微信：ai-front
作者簡介：面向AI愛好者、開發(fā)者和科學(xué)家，提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實踐案例，助你全面擁抱AIGC。

閱讀原文

# AIGC動態(tài)# 華為 # 快手 # 模型 # 能力 # 騰訊

? 版權(quán)聲明

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載。

暫無評論

暫無評論...

一群頂尖搜索人才如何2個月出貨，還把GPU利用率干到60%！揭秘百川智能研發(fā)大模型這一年

AIGC動態(tài)歡迎閱讀

內(nèi)容摘要：

聯(lián)系作者

太全了！蘋果上新視覺模型4M-21，搞定21種模態(tài)

視覺AI的「Foundation Model」，已經(jīng)發(fā)展到哪一步？丨CVPR 2024現(xiàn)場直擊

相關(guān)文章

暫無評論

ChatGPT

畢業(yè)論文生成器

AIGC熱點

一群頂尖搜索人才如何2個月出貨，還把GPU利用率干到60%！揭秘百川智能研發(fā)大模型這一年

AIGC動態(tài)歡迎閱讀

內(nèi)容摘要：

聯(lián)系作者

太全了！蘋果上新視覺模型4M-21，搞定21種模態(tài)

視覺AI的「Foundation Model」，已經(jīng)發(fā)展到哪一步？丨CVPR 2024現(xiàn)場直擊

相關(guān)文章

暫無評論

ChatGPT

畢業(yè)論文生成器

AIGC熱點

太全了！蘋果上新視覺模型4M-21，搞定21種模態(tài)

視覺AI的「Foundation Model」，已經(jīng)發(fā)展到哪一步？丨CVPR 2024現(xiàn)場直擊