AIGC動態歡迎閱讀
原標題:一群頂尖搜索人才如何2個月出貨,還把GPU利用率干到60%!揭秘百川智能研發大模型這一年
關鍵字:模型,騰訊,華為,快手,能力
文章來源:AI前線
內容字數:0字
內容摘要:
作者|褚杏娟 采訪嘉賓|陳煒鵬
去年的大模型之戰講究一個“快”字:入場快、發布快、迭代快。
王小川在去年 4 月份宣布成立“百川智能”的兩個月后,就迅速對外推出了 70 億參數量的中英文預訓練大模型 Baichuan 7B。一年多后的今天,百川智能已經將大模型迭代到了 Baichuan 4。
曾擔任搜狗搜索研發總經理的陳煒鵬如今在百川智能負責模型研發,這對他來講也是一次挑戰。“搜索與模型研發有很大的不同,研發經驗不一定能完全復刻,比如兩者對數據的定義可能完全不一樣。”
但陳煒鵬也表示,做搜索和大模型也有共性,就是它們都是系統性工程。“在大模型之前,被認為系統性工程的算法問題只有三個:搜索系統、推薦系統和廣告系統。以前的搜索經驗讓我知道怎么樣解決一個系統性的問題。”
實際上,百川智能的技術團隊可以分為兩部分:一部分是像陳煒鵬這樣有很強系統性工程經驗的人,他們做過復雜的項目,知道怎樣把復雜的問題拆解成為子問題,然后做有效的科學管理;另一部分則是對語言模型本身有很好認知的研發人員。
“大模型的研發不是一個單點問題,而是一個系統問題。解決系統性問題,是我們團隊的優勢。”陳煒鵬說道。那百川智能(
原文鏈接:一群頂尖搜索人才如何2個月出貨,還把GPU利用率干到60%!揭秘百川智能研發大模型這一年
聯系作者
文章來源:AI前線
作者微信:ai-front
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...