AIGC動態歡迎閱讀
原標題:英偉達開源最強通用模型Nemotron-4 340B
關鍵字:模型,數據,參數,高效,基礎
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
機器之心編輯部性能超越 Llama-3,主要用于合成數據。英偉達的通用大模型 Nemotron,開源了最新的 3400 億參數版本。
本周五,英偉達宣布推出 Nemotron-4 340B。它包含一系列開放模型,開發人員可以使用這些模型生成合成數據,用于訓練大語言模型(LLM),可用于醫療健康、金融、制造、零售等所有行業的商業應用。
高質量的訓練數據在自定義 LLM 的響應性能、準確性和質量中起著至關重要的作用 —— 但強大的數據集經常是昂貴且難以訪問的。通過獨特的開放模型許可,Nemotron-4 340B 為開發人員提供了一種免費、可擴展的方式來生成合成數據,從而幫助人們構建強大的 LLM。
Nemotron-4 340B 系列包括基礎、Instruct 和 Reward 模型,它們形成了一個 pipeline,用于生成訓練和改進 LLM 的合成數據。這些模型經過優化,可與 NVIDIA NeMo 配合使用,后者是一個用于端到端模型訓練的開源框架,包括數據管理、定制和評估。它們還針對開源 NVIDIA TensorRT-LLM 庫的推理進行了優化。
英偉達表示,Nem
原文鏈接:英偉達開源最強通用模型Nemotron-4 340B
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...