打通大模型訓(xùn)練任督二脈!國(guó)內(nèi)首個(gè)千億參數(shù)、全面開(kāi)源大模型來(lái)了,還聯(lián)手開(kāi)發(fā)者共訓(xùn)
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:打通大模型訓(xùn)練任督二脈!國(guó)內(nèi)首個(gè)千億參數(shù)、全面開(kāi)源大模型來(lái)了,還聯(lián)手開(kāi)發(fā)者共訓(xùn)
關(guān)鍵字:模型,浪潮,數(shù)據(jù),信息,能力
文章來(lái)源:智東西
內(nèi)容字?jǐn)?shù):10191字
內(nèi)容摘要:浪潮信息算法、數(shù)據(jù)、計(jì)算三大創(chuàng)新黑科技,大幅提升大模型智力水平。作者|程茜編輯|漠影智東西11月30日?qǐng)?bào)道,11月27日,算力龍頭企業(yè)浪潮信息發(fā)布了完全開(kāi)源且可免費(fèi)商用的源2.0基礎(chǔ)大模型,包含1026億、518億、21億不同參數(shù)規(guī)模,這也是國(guó)內(nèi)首個(gè)千億參數(shù)、全面開(kāi)源的大模型。浪潮信息源2.0大模型在數(shù)理邏輯、數(shù)學(xué)計(jì)算、代碼生成能力方面大幅提升,且在HumanEval、AGIEval、GMS-8K等知名評(píng)測(cè)集上的表現(xiàn),超過(guò)了ChatGPT的精度,接近GPT-4的精度。此外,昨天在AICC 2023人工智能計(jì)算大會(huì)上,浪潮信息還公布了源大模型共訓(xùn)計(jì)劃,針對(duì)開(kāi)發(fā)者自己的應(yīng)用或場(chǎng)景需求,該公司通過(guò)訓(xùn)練數(shù)據(jù)并對(duì)源大模型進(jìn)行增強(qiáng)訓(xùn)練,然后將其在社區(qū)開(kāi)源。如今,各類大模型創(chuàng)新應(yīng)用頻發(fā),歸根結(jié)底,大模型商用問(wèn)題都集中于模型基礎(chǔ)能力的提升。浪潮信息高級(jí)副總裁、AI HPC總經(jīng)理劉軍談道, 客戶端碰到的較大…
聯(lián)系作者
文章來(lái)源:智東西
作者微信:zhidxcom
作者簡(jiǎn)介:智能產(chǎn)業(yè)新媒體!智東西專注報(bào)道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)升級(jí)。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。