AIGC動態歡迎閱讀
原標題:中電信AI大模型TeleChat-12B評測:使用3T tokens預訓練,已開源!
關鍵字:模型,數據,代碼,方面,指令
文章來源:算法邦
內容字數:6572字
內容摘要:
直播預告 | 5月14日晚7點,「智猩猩、AI新青年講座」第235講正式開講,慕尼黑工業大學視覺實驗室陳振宇博士將直播講解《三維室內場景紋理圖生成》歡迎掃名~01前言2月份的時候評測過TeleChat-7B大模型,見星辰AI大模型TeleChat-7B評測。最近中電信 AI 科技有限公司針對TeleChat-7B進行了性能升級,并開源了一個更大的模型TeleChat-12B,受邀對這個大模型進行新的評測。本文主要關注TeleChat-7B在做一些文學創作和代碼生成方面相比于TeleChat-7B的提升。TeleChat-7B不僅在模型結構上有所微調,而且相比于TeleChat-7B的1.5T Tokens,TeleChat-12B使用了3T Tokens進行預訓練,取得了更好的性能結果。下面紅框部分是TeleChat-12B相比于TeleChat-7B在通用能力,推理和代碼能力,語言理解能力等維度的數據集上的性能提升:
在這里插入圖片描述
02TeleChat-12B相比于TeleChat-7B的差異點TeleChat-12B和TeleChat-7B均開源在https://gith
原文鏈接:中電信AI大模型TeleChat-12B評測:使用3T tokens預訓練,已開源!
聯系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:智猩猩矩陣賬號之一,聚焦生成式AI,重點關注模型與應用。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...