AIGC動態歡迎閱讀
原標題:通義千問再開源,Qwen1.5帶來六種體量模型,性能超越GPT3.5
關鍵字:模型,能力,基準,團隊,阿里
文章來源:機器之心
內容字數:5601字
內容摘要:
機器之心報道
編輯:澤南超越 Claude、GPT-3.5,提升了多語言支持能力。趕在春節前,通義千問大模型(Qwen)的 1.5 版上線了。今天上午,新版本的消息引發了 AI 社區關注。
新版大模型包括六個型號尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最強版本的性能超越了 GPT 3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多語言支持。
阿里通義千問團隊表示,相關技術也已經上線到了通義千問官網和通義千問 App。
除此以外,今天 Qwen 1.5 的發布還有如下一些重點:
支持 32K 上下文長度;
開放了 Base + Chat 模型的 checkpoint;
可與 Transformers 一起本地運行;
同時發布了 GPTQ Int-4 / Int8、AWQ 和 GGUF 權重。
借助更先進的大模型作為評委,通義千問團隊在兩個廣泛使用的基準 MT-Bench 和 Alpaca-Eval 上對 Qwen1.5 進行了初步評估,評估結果如下:盡管落后于 GPT-4-Turbo,但最大版本的 Qwen1.5 模型 Qwen1.
原文鏈接:通義千問再開源,Qwen1.5帶來六種體量模型,性能超越GPT3.5
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...