10人明星團隊煉出首個微調(diào)Llama 3.1 405B!角色扮演一秒入戲,代碼全開源
AIGC動態(tài)歡迎閱讀
原標(biāo)題:10人明星團隊煉出首個微調(diào)Llama 3.1 405B!角色扮演一秒入戲,代碼全開源
關(guān)鍵字:報告,模型,數(shù)據(jù),指令,能力
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報道編輯:編輯部
【新智元導(dǎo)讀】發(fā)布40天后,最強開源模型Llama 3.1 405B等來了微調(diào)版本的發(fā)布。但不是來自Meta,而是一個專注于開放模型的神秘初創(chuàng)Nous Research。Llama 3.1的405B模型終于等來了首個微調(diào)版本!
這個模型名為Hermes 3,來自初創(chuàng)公司Nous Research,是一個相當(dāng)小型且低調(diào)的團隊。
雖然公司低調(diào),但技術(shù)實力相當(dāng)強悍。Hermes系列已經(jīng)微調(diào)了Mistral、Yi、Llama等多個開源模型,下載量超過3300萬次。
跟著模型一起發(fā)布的,還有完整的技術(shù)報告和博客,Lambda Chat也同時在界面中集成了模型。
從技術(shù)報告和博客來看,Nous Research的這次微調(diào)頗有成效,在使用了FP8量化后還能保持相當(dāng)水準(zhǔn)的模型性能。
這種優(yōu)化有效地將模型的VRAM和磁盤需求降低了約50%,使其能夠在單個節(jié)點上運行,方便更多開發(fā)者部署使用。
除此之外,SFT和DPO的微調(diào)過程經(jīng)過了專門設(shè)計,讓模型的對話能力和指令遵循能力大大增強,擅長復(fù)雜的角色扮演和創(chuàng)意寫作。
除了創(chuàng)造力,Hermes 3還擴展出了函數(shù)調(diào)用、分步推理等智能體
原文鏈接:10人明星團隊煉出首個微調(diào)Llama 3.1 405B!角色扮演一秒入戲,代碼全開源
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介: