寧德核電推出全球參數(shù)量最大的核工業(yè)大模型|InfoQ 獨家
AIGC動態(tài)歡迎閱讀
原標題:寧德核電推出全球參數(shù)量最大的核工業(yè)大模型|InfoQ 獨家
關(guān)鍵字:核電,核工業(yè),模型,報告,數(shù)據(jù)
文章來源:AI前線
內(nèi)容字數(shù):13480字
內(nèi)容摘要:
作者 |羅燕珊
核電行業(yè)是工業(yè)場景中相對復(fù)雜、安全性能要求極高的場景。如果AI大模型在如此復(fù)雜的場景中被驗證可行,其經(jīng)驗將為該技術(shù)在其他工業(yè)領(lǐng)域的應(yīng)用帶來極大的借鑒意義。
InfoQ 數(shù)字化經(jīng)緯獲悉,中國廣核集團福建寧德核電有限公司(以下簡稱“寧德核電”)日前發(fā)布了自主訓練的大模型「錦書」,這是專為核工業(yè)領(lǐng)域打造的大語言模型,其參數(shù)規(guī)模達到 720 億。
據(jù)了解,「錦書」在內(nèi)部被稱為“全民 GPT”項目,自 2023 年 5 月發(fā)起,旨在探索利用 AI 大模型解決核電行業(yè)面臨的各種挑戰(zhàn),如知識管理不足、低腦力勞動過多、安全分析能力有待增強等。
「錦書」主要訓練兩種參數(shù)規(guī)格的模型,分別是錦書 -34B-Chat 和錦書 -72b-Chat。這也是目前在全球范圍內(nèi)參數(shù)量最大的核工業(yè)預(yù)訓練大語言模型。此外,「錦書」擁有中國最大的核工業(yè)大模型語料庫,訓練語料超過 20 億 token,涵蓋了核運行、核物理、核燃料、水化學十余類通用核工業(yè)語料以及規(guī)程、系統(tǒng)設(shè)計書、經(jīng)驗反饋單等十余種工作文件語料。
此外,寧德核電團隊首次開發(fā)適用于核工業(yè)的專屬 Nuclear-embedding-v1-base-c
原文鏈接:寧德核電推出全球參數(shù)量最大的核工業(yè)大模型|InfoQ 獨家
聯(lián)系作者
文章來源:AI前線
作者微信:ai-front
作者簡介:面向AI愛好者、開發(fā)者和科學家,提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實踐案例,助你全面擁抱AIGC。