阿里除夕發(fā)布Qwen2.5-Max反超DeepSeek V3,一句話開發(fā)小游戲
網(wǎng)友:新年快樂,特別是奧特曼
原標(biāo)題:阿里除夕發(fā)布Qwen2.5-Max反超DeepSeek V3,一句話開發(fā)小游戲
文章來源:量子位
內(nèi)容字?jǐn)?shù):2144字
阿里通義Qwen2.5-Max:春節(jié)大模型驚喜來襲
大年初一,阿里巴巴通義大模型團(tuán)隊發(fā)布了Qwen2.5-Max,作為春節(jié)的第三彈驚喜,這款超大規(guī)模的MoE模型在多個基準(zhǔn)測試中表現(xiàn)出色,引發(fā)了廣泛關(guān)注。
1. 性能超越多款主流模型
Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基準(zhǔn)測試中均取得了優(yōu)異成績,整體性能超越了DeepSeek V3、Llama-3.1-405B以及閉源模型GPT-4o,甚至可以與Claude-3.5-Sonnet相媲美。在基座模型對比中,它也超越了DeepSeek V3和Llama-3.1-405B,并在MMLU-Pro等評估模型知識理解和推理能力的基準(zhǔn)測試中表現(xiàn)突出。
2. 強(qiáng)大的模型架構(gòu)和訓(xùn)練數(shù)據(jù)
與DeepSeek V3一樣,Qwen2.5-Max也是一個超大規(guī)模的MoE模型,經(jīng)過超過20萬億token的預(yù)訓(xùn)練數(shù)據(jù)以及精心設(shè)計的SFT+RLHF后訓(xùn)練方案訓(xùn)練而成。這表明阿里巴巴在模型訓(xùn)練方面投入了大量的資源和技術(shù)。
3. 多模態(tài)能力展示及應(yīng)用場景
Qwen2.5-Max展現(xiàn)了強(qiáng)大的多模態(tài)能力,例如:聯(lián)網(wǎng)搜索功能,能夠標(biāo)注信息來源;代碼能力方面,可以根據(jù)用戶需求生成各種可視化效果,例如創(chuàng)建旋轉(zhuǎn)的球體,甚至在球體內(nèi)部添加彈跳的小球,并能準(zhǔn)確處理碰撞;它還具備Artifacts功能,可以快速開發(fā)小應(yīng)用和小游戲,例如掃雷游戲;此外,它還能輕松統(tǒng)計單詞中特定字母的數(shù)量。
4. 便捷的訪問方式
目前,Qwen2.5-Max已在Qwen Chat中上線,用戶也可以通過Hugging Face Demo、Any Chat以及阿里云服務(wù)API進(jìn)行訪問,方便開發(fā)者和用戶體驗和使用。
5. 研發(fā)團(tuán)隊的辛勤付出
阿里巴巴的研究員們在春節(jié)期間仍然堅持工作,積極推廣Qwen2.5-Max。阿里高級算法專家林俊旸和Binyuan Hui等人在社交媒體上分享了他們的工作和感受,體現(xiàn)了研發(fā)團(tuán)隊的敬業(yè)精神和對產(chǎn)品的信心。
總而言之,Qwen2.5-Max的發(fā)布是阿里巴巴在大型語言模型領(lǐng)域取得的重要進(jìn)展,其強(qiáng)大的性能和多樣的應(yīng)用場景使其成為一個備受矚目的新興模型。其便捷的訪問方式也降低了用戶體驗的門檻,為人工智能技術(shù)的普及和應(yīng)用提供了新的動力。
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破