一群頂尖搜索人才如何2個月出貨,還把GPU利用率干到60%!揭秘百川智能研發(fā)大模型這一年
AIGC動態(tài)歡迎閱讀
原標(biāo)題:一群頂尖搜索人才如何2個月出貨,還把GPU利用率干到60%!揭秘百川智能研發(fā)大模型這一年
關(guān)鍵字:模型,騰訊,華為,快手,能力
文章來源:AI前線
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
作者|褚杏娟 采訪嘉賓|陳煒鵬
去年的大模型之戰(zhàn)講究一個“快”字:入場快、發(fā)布快、迭代快。
王小川在去年 4 月份宣布成立“百川智能”的兩個月后,就迅速對外推出了 70 億參數(shù)量的中英文預(yù)訓(xùn)練大模型 Baichuan 7B。一年多后的今天,百川智能已經(jīng)將大模型迭代到了 Baichuan 4。
曾擔(dān)任搜狗搜索研發(fā)總經(jīng)理的陳煒鵬如今在百川智能負(fù)責(zé)模型研發(fā),這對他來講也是一次挑戰(zhàn)。“搜索與模型研發(fā)有很大的不同,研發(fā)經(jīng)驗不一定能完全復(fù)刻,比如兩者對數(shù)據(jù)的定義可能完全不一樣。”
但陳煒鵬也表示,做搜索和大模型也有共性,就是它們都是系統(tǒng)性工程。“在大模型之前,被認(rèn)為系統(tǒng)性工程的算法問題只有三個:搜索系統(tǒng)、推薦系統(tǒng)和廣告系統(tǒng)。以前的搜索經(jīng)驗讓我知道怎么樣解決一個系統(tǒng)性的問題。”
實(shí)際上,百川智能的技術(shù)團(tuán)隊可以分為兩部分:一部分是像陳煒鵬這樣有很強(qiáng)系統(tǒng)性工程經(jīng)驗的人,他們做過復(fù)雜的項目,知道怎樣把復(fù)雜的問題拆解成為子問題,然后做有效的科學(xué)管理;另一部分則是對語言模型本身有很好認(rèn)知的研發(fā)人員。
“大模型的研發(fā)不是一個單點(diǎn)問題,而是一個系統(tǒng)問題。解決系統(tǒng)性問題,是我們團(tuán)隊的優(yōu)勢。”陳煒鵬說道。那百川智能(
原文鏈接:一群頂尖搜索人才如何2個月出貨,還把GPU利用率干到60%!揭秘百川智能研發(fā)大模型這一年
聯(lián)系作者
文章來源:AI前線
作者微信:ai-front
作者簡介:面向AI愛好者、開發(fā)者和科學(xué)家,提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實(shí)踐案例,助你全面擁抱AIGC。