“階躍星辰Step-2:登頂中國(guó)大模型,揭示最不可能作弊的秘密!”
在“最難AI榜”,拿下中國(guó)第一、全球第五。
原標(biāo)題:登上“最不可能作弊”的榜單,階躍星辰Step-2位列中國(guó)大模型第一|甲子光年
文章來(lái)源:甲子光年
內(nèi)容字?jǐn)?shù):4490字
階躍星辰在LiveBench榜單的驚人表現(xiàn)
2023年11月19日,國(guó)際權(quán)威榜單LiveBench公布了最新的語(yǔ)言大模型測(cè)評(píng)結(jié)果。中國(guó)公司階躍星辰自研的萬(wàn)億參數(shù)語(yǔ)言大模型Step-2-16k-202411(簡(jiǎn)稱Step-2)榮獲全球第五,成為唯一進(jìn)入前十的中國(guó)公司,超越多個(gè)國(guó)際主流模型,展現(xiàn)出強(qiáng)大的技術(shù)實(shí)力。
1. LiveBench榜單的權(quán)威性
LiveBench是由圖靈獎(jiǎng)得主楊立昆等機(jī)構(gòu)推出的新興大模型基準(zhǔn)測(cè)試,以其嚴(yán)格的評(píng)測(cè)標(biāo)準(zhǔn)和特殊的評(píng)測(cè)機(jī)制著稱。它旨在消除“刷榜作弊”的可能性,確保評(píng)測(cè)結(jié)果的客觀性。評(píng)估范圍廣泛,至今已評(píng)估多個(gè)閉源和開源模型。
2. Step-2的卓越性能
階躍星辰的Step-2在IF Average(指令跟隨)方面表現(xiàn)尤為突出,超越所有國(guó)內(nèi)外語(yǔ)言大模型。這表明Step-2在語(yǔ)言生成上具備出色的理解和執(zhí)行能力。相比于千億參數(shù)的Step-1,Step-2在綜合能力上提升了近50%,在編程、邏輯推理和知識(shí)理解等方面均有顯著進(jìn)步。
3. MoE架構(gòu)的創(chuàng)新
Step-2采用了萬(wàn)億參數(shù)和MoE架構(gòu),能夠更有效地處理復(fù)雜問(wèn)題。通過(guò)專家共享參數(shù)和異構(gòu)化設(shè)計(jì),Step-2確保每個(gè)“專家模型”都得到充分訓(xùn)練,使得其在每次推理時(shí)激活的參數(shù)量超過(guò)多數(shù)稠密模型。這一創(chuàng)新設(shè)計(jì)是Step-2強(qiáng)大能力的根本原因。
4. 全面的戰(zhàn)略布局
階躍星辰不僅專注于大語(yǔ)言模型,同時(shí)也積極布局多模態(tài)模型,形成了完整的模型矩陣。其快速的模型迭代速度使其在國(guó)內(nèi)外同行中脫穎而出。2024年,階躍星辰已經(jīng)發(fā)布了多個(gè)大模型,涵蓋從千億參數(shù)到萬(wàn)億參數(shù)的全面能力。
總結(jié)
階躍星辰的成功不僅展示了其在大模型研發(fā)領(lǐng)域的技術(shù)實(shí)力,也為實(shí)現(xiàn)AGI(通用人工智能)奠定了基礎(chǔ)。隨著AI技術(shù)的不斷發(fā)展,階躍星辰及其他國(guó)產(chǎn)大模型有望在未來(lái)創(chuàng)造更多的驚喜。
聯(lián)系作者
文章來(lái)源:甲子光年
作者微信:
作者簡(jiǎn)介:甲子光年是一家科技智庫(kù),包含智庫(kù)、社群、企業(yè)服務(wù)版塊,立足中國(guó)科技創(chuàng)新前沿陣地,動(dòng)態(tài)跟蹤頭部科技企業(yè)發(fā)展和傳統(tǒng)產(chǎn)業(yè)技術(shù)升級(jí)案例,推動(dòng)人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、新能源、新材料、信息安全、大健康等科技創(chuàng)新在產(chǎn)業(yè)中的應(yīng)用與落地。