李沐老師回歸B站！帶著大模型創(chuàng)業(yè)成果填坑來(lái)了

AIGC動(dòng)態(tài)2年前 (2024)發(fā)布量子位

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：李沐老師回歸B站！帶著大模型創(chuàng)業(yè)成果填坑來(lái)了
關(guān)鍵字：模型,基準(zhǔn),團(tuán)隊(duì),量子,角色扮演
文章來(lái)源：量子位
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

西風(fēng) 發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI終于，AI大神李沐回來(lái)了！帶著他的大模型創(chuàng)業(yè)最新成果——
一個(gè)專門為復(fù)雜場(chǎng)景角色扮演設(shè)計(jì)的大模型，名為Higgs-Llama-3-70B。
得知消息的不少網(wǎng)友已激動(dòng)在評(píng)論區(qū)催更，李沐老師也回應(yīng)，視頻坑還是會(huì)填的：
想你的365天。
終于回來(lái)了，視頻都盤包漿了。
那沐神到底干啥去了？這就透過(guò)Higgs-Llama-3-70B瞧一瞧。
定睛一看，Higgs-Llama-3-70B是沐神去年聯(lián)合創(chuàng)立的公司Boson AI，推出的Higgs開源系列大模型中的第一個(gè)，基于Llama 3打造，做了完整的SFT、RLHF。
它不僅能在角色扮演任務(wù)上表現(xiàn)優(yōu)異，在通用領(lǐng)域上的指令遵循和推理方面也很有競(jìng)爭(zhēng)力。
另外還有市場(chǎng)消息稱，Boson AI已獲投資。
左擊Claude3，右打Gemini團(tuán)隊(duì)在兩個(gè)新基準(zhǔn)測(cè)試MMLU-Pro和Arena-hard上展示了Higgs-Llama-3-70B的能力。
他們還特地強(qiáng)調(diào)所有基準(zhǔn)測(cè)試終將導(dǎo)致過(guò)擬合，已盡量從微調(diào)數(shù)據(jù)中排除了基準(zhǔn)測(cè)試數(shù)據(jù)及其訓(xùn)練示例。
具體來(lái)說(shuō)，MMLU-Pro是MMLU的擴(kuò)展，團(tuán)隊(duì)認(rèn)為MMLU-P

原文鏈接：李沐老師回歸B站！帶著大模型創(chuàng)業(yè)成果填坑來(lái)了