中電信AI大模型TeleChat-12B評測:使用3T tokens預(yù)訓練,已開源!
AIGC動態(tài)歡迎閱讀
原標題:中電信AI大模型TeleChat-12B評測:使用3T tokens預(yù)訓練,已開源!
關(guān)鍵字:模型,數(shù)據(jù),代碼,方面,指令
文章來源:算法邦
內(nèi)容字數(shù):6572字
內(nèi)容摘要:
直播預(yù)告 | 5月14日晚7點,「智猩猩、AI新青年講座」第235講正式開講,慕尼黑工業(yè)大學視覺實驗室陳振宇博士將直播講解《三維室內(nèi)場景紋理圖生成》歡迎掃名~01前言2月份的時候評測過TeleChat-7B大模型,見星辰AI大模型TeleChat-7B評測。最近中電信 AI 科技有限公司針對TeleChat-7B進行了性能升級,并開源了一個更大的模型TeleChat-12B,受邀對這個大模型進行新的評測。本文主要關(guān)注TeleChat-7B在做一些文學創(chuàng)作和代碼生成方面相比于TeleChat-7B的提升。TeleChat-7B不僅在模型結(jié)構(gòu)上有所微調(diào),而且相比于TeleChat-7B的1.5T Tokens,TeleChat-12B使用了3T Tokens進行預(yù)訓練,取得了更好的性能結(jié)果。下面紅框部分是TeleChat-12B相比于TeleChat-7B在通用能力,推理和代碼能力,語言理解能力等維度的數(shù)據(jù)集上的性能提升:
在這里插入圖片描述
02TeleChat-12B相比于TeleChat-7B的差異點TeleChat-12B和TeleChat-7B均開源在https://gith
原文鏈接:中電信AI大模型TeleChat-12B評測:使用3T tokens預(yù)訓練,已開源!
聯(lián)系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:智猩猩矩陣賬號之一,聚焦生成式AI,重點關(guān)注模型與應(yīng)用。