老黃不止賣鏟子了:英偉達(dá)配合Llama3.1推出定制模型、推理服務(wù)
AIGC動態(tài)歡迎閱讀
原標(biāo)題:老黃不止賣鏟子了:英偉達(dá)配合Llama3.1推出定制模型、推理服務(wù)
關(guān)鍵字:模型,數(shù)據(jù),企業(yè),護(hù)欄,高效
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
夢晨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI芯片巨頭英偉達(dá),在AI時代一直被類比為在淘金熱中“賣鏟子”的背后贏家。
現(xiàn)在他不裝了,也要親自下場“挖金礦”:
配合最強(qiáng)開源大模型Llama3.1,推出NVIDIA AI Foundry和NVIDIA NIM推理微服務(wù)兩大新業(yè)務(wù)。
Foundry在芯片行業(yè)指“鑄造廠”,比如臺積電制造其他公司設(shè)計的芯片。
NVIDIA AI Foundry,代表英偉達(dá)可以定制化制造大模型了:
NVIDIA AI Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護(hù)到評估的全方位生成式AI模型服務(wù)。
NVIDIA NIM在年初的GTC大會上首次亮相,使用幾行代碼就可以在云、數(shù)據(jù)中心、工作站和PC上部署AI模型。
現(xiàn)在則又新加一個標(biāo)簽:將Llama 3.1模型部署到生產(chǎn)中的最快途徑,吞吐量最多可比不使用NIM運行推理時高出2.5倍。
為什么在這個時間點出手?
黃仁勛表示:“Meta的Llama 3.1開源模型標(biāo)志著全球企業(yè)采用生成式 AI 的關(guān)鍵時刻已經(jīng)到來”。
企業(yè)可以將Llama 3.1 NIM 微服務(wù)與與全新NVIDIA NeMo Retri
原文鏈接:老黃不止賣鏟子了:英偉達(dá)配合Llama3.1推出定制模型、推理服務(wù)
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介: