李沐老師回歸B站!帶著大模型創(chuàng)業(yè)成果填坑來(lái)了
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:李沐老師回歸B站!帶著大模型創(chuàng)業(yè)成果填坑來(lái)了
關(guān)鍵字:模型,基準(zhǔn),團(tuán)隊(duì),量子,角色扮演
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI終于,AI大神李沐回來(lái)了!帶著他的大模型創(chuàng)業(yè)最新成果——
一個(gè)專門為復(fù)雜場(chǎng)景角色扮演設(shè)計(jì)的大模型,名為Higgs-Llama-3-70B。
得知消息的不少網(wǎng)友已激動(dòng)在評(píng)論區(qū)催更,李沐老師也回應(yīng),視頻坑還是會(huì)填的:
想你的365天。
終于回來(lái)了,視頻都盤包漿了。
那沐神到底干啥去了?這就透過(guò)Higgs-Llama-3-70B瞧一瞧。
定睛一看,Higgs-Llama-3-70B是沐神去年聯(lián)合創(chuàng)立的公司Boson AI,推出的Higgs開源系列大模型中的第一個(gè),基于Llama 3打造,做了完整的SFT、RLHF。
它不僅能在角色扮演任務(wù)上表現(xiàn)優(yōu)異,在通用領(lǐng)域上的指令遵循和推理方面也很有競(jìng)爭(zhēng)力。
另外還有市場(chǎng)消息稱,Boson AI已獲投資。
左擊Claude3,右打Gemini團(tuán)隊(duì)在兩個(gè)新基準(zhǔn)測(cè)試MMLU-Pro和Arena-hard上展示了Higgs-Llama-3-70B的能力。
他們還特地強(qiáng)調(diào)所有基準(zhǔn)測(cè)試終將導(dǎo)致過(guò)擬合,已盡量從微調(diào)數(shù)據(jù)中排除了基準(zhǔn)測(cè)試數(shù)據(jù)及其訓(xùn)練示例。
具體來(lái)說(shuō),MMLU-Pro是MMLU的擴(kuò)展,團(tuán)隊(duì)認(rèn)為MMLU-P
原文鏈接:李沐老師回歸B站!帶著大模型創(chuàng)業(yè)成果填坑來(lái)了
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破