又一千億級大模型問世，全面開源！

AIGC動態(tài)2年前 (2023)發(fā)布夕小瑤科技說

又一千億級大模型問世，全面開源！

AIGC動態(tài)歡迎閱讀

原標(biāo)題：又一千億級大模型問世，全面開源！

文章來源：夕小瑤科技說

內(nèi)容字?jǐn)?shù)：1995字

內(nèi)容摘要：夕小瑤科技說分享11月27日，浪潮信息發(fā)布“源2.0”基礎(chǔ)大模型，并宣布全面開源。源2.0基礎(chǔ)大模型包括1026億、518億、21億等三種參數(shù)規(guī)模的模型，在編程、推理、邏輯等方面展示出了先進的能力。當(dāng)前，大模型技術(shù)正在推動生成式人工智能產(chǎn)業(yè)迅猛發(fā)展，而基礎(chǔ)大模型的關(guān)鍵能力則是大模型在行業(yè)和應(yīng)用落地能力表現(xiàn)的核心支撐，但基礎(chǔ)大模型的發(fā)展也面臨著在算法、數(shù)據(jù)和算力等方面的諸多挑戰(zhàn)。源2.0基礎(chǔ)大模型則針對性地提出了新的改進方法并獲得了能力的提升。算法方面，源2.0提出并采用了一種新型的注意力算法結(jié)構(gòu)：局部注意力過濾增強機制(LFA：Localized Filtering-based Attention)。LFA通過先學(xué)習(xí)相鄰詞之間的關(guān)聯(lián)性，然后再計算全局關(guān)聯(lián)性的方法，能夠更好地學(xué)習(xí)到自然語言的局部和全局的語言特征，對于自然語言的關(guān)聯(lián)語義理解更準(zhǔn)確、更人性，提升了模型的自然語言表達能力，進而提…

原文鏈接：點此閱讀原文：又一千億級大模型問世，全面開源！