首批中文版Llama3模型來了,解釋成語、答弱智吧問題
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:首批中文版Llama3模型來了,解釋成語、答弱智吧問題
關(guān)鍵字:模型,知乎,清華大學(xué),中文,基準(zhǔn)
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):8638字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:小舟、張倩中文問題,中文回答。最近,Meta 推出了 Llama 3,為開源大模型樹立了新的標(biāo)桿。
和以往的原始 Llama 模型一樣,Llama 3 對(duì)中文的支持效果欠佳,經(jīng)常會(huì)出現(xiàn)你用中文提問,它用英文或中文+英文回復(fù)的現(xiàn)象。因此,要想讓國(guó)內(nèi)用戶用上該模型,開發(fā)者還需對(duì)其進(jìn)行微調(diào)。
最近,在 Github 以及 HuggingFace 平臺(tái)上,我們已經(jīng)陸陸續(xù)續(xù)地看到了一些這樣的項(xiàng)目,比如 llama3-Chinese-chat 和 Llama3-8B-Chinese-Chat。這篇文章將逐一介紹。
llama3-Chinese-chat
llama3-Chinese-chat 是一個(gè) Github 項(xiàng)目,由名為「Ke Bai」的開發(fā)者開發(fā)。項(xiàng)目鏈接:https://github.com/CrazyBoyM/llama3-Chinese-chat
該模型效果如下:作者表示,該模型使用 170k + 高質(zhì)量多輪中文對(duì)話數(shù)據(jù)連夜訓(xùn)練得到。他還整理了一份可用的訓(xùn)練數(shù)據(jù)列表,里面包含弱智吧、小紅書、知乎等網(wǎng)絡(luò)數(shù)據(jù)和開發(fā)者自己制作的數(shù)據(jù)。模型推理成本如下:
fp16 模式大
原文鏈接:首批中文版Llama3模型來了,解釋成語、答弱智吧問題
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)