英偉達(dá)開源最強(qiáng)通用模型Nemotron-4 340B

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:英偉達(dá)開源最強(qiáng)通用模型Nemotron-4 340B
關(guān)鍵字:模型,數(shù)據(jù),參數(shù),高效,基礎(chǔ)
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心報(bào)道
機(jī)器之心編輯部性能超越 Llama-3,主要用于合成數(shù)據(jù)。英偉達(dá)的通用大模型 Nemotron,開源了最新的 3400 億參數(shù)版本。
本周五,英偉達(dá)宣布推出 Nemotron-4 340B。它包含一系列開放模型,開發(fā)人員可以使用這些模型生成合成數(shù)據(jù),用于訓(xùn)練大語言模型(LLM),可用于醫(yī)療健康、金融、制造、零售等所有行業(yè)的商業(yè)應(yīng)用。
高質(zhì)量的訓(xùn)練數(shù)據(jù)在自定義 LLM 的響應(yīng)性能、準(zhǔn)確性和質(zhì)量中起著至關(guān)重要的作用 —— 但強(qiáng)大的數(shù)據(jù)集經(jīng)常是昂貴且難以訪問的。通過獨(dú)特的開放模型許可,Nemotron-4 340B 為開發(fā)人員提供了一種免費(fèi)、可擴(kuò)展的方式來生成合成數(shù)據(jù),從而幫助人們構(gòu)建強(qiáng)大的 LLM。
Nemotron-4 340B 系列包括基礎(chǔ)、Instruct 和 Reward 模型,它們形成了一個(gè) pipeline,用于生成訓(xùn)練和改進(jìn) LLM 的合成數(shù)據(jù)。這些模型經(jīng)過優(yōu)化,可與 NVIDIA NeMo 配合使用,后者是一個(gè)用于端到端模型訓(xùn)練的開源框架,包括數(shù)據(jù)管理、定制和評(píng)估。它們還針對開源 NVIDIA TensorRT-LLM 庫的推理進(jìn)行了優(yōu)化。
英偉達(dá)表示,Nem
原文鏈接:英偉達(dá)開源最強(qiáng)通用模型Nemotron-4 340B
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)

粵公網(wǎng)安備 44011502001135號(hào)