蘋果大模型最大動作:開源M芯專用ML框架,能跑70億大模型

AIGC動態(tài)歡迎閱讀
原標(biāo)題:蘋果大模型最大動作:開源M芯專用ML框架,能跑70億大模型
文章來源:量子位
內(nèi)容字?jǐn)?shù):3141字
內(nèi)容摘要:蕭簫 發(fā)自 凹非寺量子位 | 公眾號 QbitAI蘋果M系列芯片專屬的機(jī)器學(xué)習(xí)框架,開源即爆火!現(xiàn)在,用上這個框架,你就能直接在蘋果GPU上跑70億參數(shù)大模型、訓(xùn)練Transformer模型或是搞LoRA微調(diào)。它由蘋果官方發(fā)布,風(fēng)格與PyTorch相似,不過并不基于任何已有框架實(shí)現(xiàn)。LeCun等大佬紛紛趕來點(diǎn)贊轉(zhuǎn)發(fā)。英偉達(dá)高級AI科學(xué)家Jim Fan贊嘆稱:這應(yīng)該是目前蘋果在開源AI開源上最大的動作了。甚至還有網(wǎng)友動起了iPhone上A芯的念頭(手動狗頭)所以,這個框架究竟長啥樣?參考多個ML框架設(shè)計這個新框架名叫MLX,有探索機(jī)器學(xué)習(xí)(ml-explore)的意思。從功能來看,MLX主要有以下幾點(diǎn)特性:API熟悉(包括C++ API、類似NumPy的Python API以及一些高級功能包近似于PyTorch的API)、可組合函數(shù)變換、惰性計算、動態(tài)圖構(gòu)建、多設(shè)備可用、統(tǒng)一內(nèi)存。框架作者A…
原文鏈接:點(diǎn)此閱讀原文:蘋果大模型最大動作:開源M芯專用ML框架,能跑70億大模型
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...

粵公網(wǎng)安備 44011502001135號