AIGC動態歡迎閱讀
原標題:國產大模型之光!伯克利最新基準發布,智譜AI打贏GPT-4和Llama 3
關鍵字:模型,報告,騰訊,小米,解讀
文章來源:智東西
內容字數:8764字
內容摘要:
讓Llama 3祛魅的新基準,“中國OpenAI”交卷了。
作者|香草
編輯|漠影
近日,Meta開源Llama 3系列模型,引發開源社區沸騰。
同時也有唱衰國產大模型的聲音出現,認為Llama 3的開源“又”將為國產大模型帶來“新突破”。但事實果真如此嗎?
智東西4月30日報道,上周,來自UC伯克利等機構的團隊LMSYS開源了大模型基準測試Arena-Hard,以高度的人類偏好一致性、可分性為優勢,同時測試數據集更新頻率高,具備優秀的開放性、動態性、科學性和權威性。
根據該基準測試,國產大模型ChatGLM3、GLM-4排名僅次于GPT-4 Turbo和Claude 3 Opus,在國內外模型中均處于領先地位。
同樣在上周發布的還有《SuperBench大模型綜合能力評測報告》,由清華大學基礎模型研究中心聯合中關村實驗室研制。在語義、代碼、對齊、智能體和安全五個榜單中,GLM-4有3項排名國內第一,其中語義理解能力更是僅次于Claude 3位列全球第二。
GLM系列模型是智譜AI自研的基座大模型,其中GLM-4是其在今年1月推出的最新一代,具備多模態、長文本、智能體等能力。
這表明,
原文鏈接:國產大模型之光!伯克利最新基準發布,智譜AI打贏GPT-4和Llama 3
聯系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...