AIGC動態歡迎閱讀
原標題:0門檻免費商用!孟子3-13B大模型正式開源,萬億token數據訓練
關鍵字:模型,峰會,語料,能力,范圍內
文章來源:量子位
內容字數:4046字
內容摘要:
白交 發自 凹非寺量子位 | 公眾號 QbitAI瀾舟科技官宣:孟子3-13B大模型正式開源!
這一主打高性價比的輕量化大模型,面向學術研究完全開放,并支持免費商用。
在MMLU、GSM8K、HUMAN-EVAL等各項基準測評估中,孟子3-13B都表現出了不錯的性能。
尤其在參數量20B以內的輕量化大模型領域,在中英文語言能力方面尤為突出,數學和編程能力也位于前列。
△以上結果基于5-shot。據介紹,孟子3-13B大模型是基于Llama架構,數據集規模高達3T Tokens。
語料精選自網頁、百科、社交、媒體、新聞,以及高質量的開源數據集。通過在萬億tokens上進行多語言語料的繼續訓練,模型的中文能力突出并且兼顧多語言能力。
孟子3-13B大模型開源只需兩步,就能使用孟子3-13B大模型了。
首先進行環境配置。
pipinstall-rrequirements.txt
然后快速開始。
importtorchfromtransformersimportAutoModelForCausalLM,AutoTokenizertokenizer=AutoTokenizer.from_pret
原文鏈接:0門檻免費商用!孟子3-13B大模型正式開源,萬億token數據訓練
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...