蘋果大模型最大動作:開源M芯專用ML框架,能跑70億大模型
AIGC動態(tài)歡迎閱讀
原標題:蘋果大模型最大動作:開源M芯專用ML框架,能跑70億大模型
文章來源:量子位
內(nèi)容字數(shù):3141字
內(nèi)容摘要:蕭簫 發(fā)自 凹非寺量子位 | 公眾號 QbitAI蘋果M系列芯片專屬的機器學(xué)習(xí)框架,開源即爆火!現(xiàn)在,用上這個框架,你就能直接在蘋果GPU上跑70億參數(shù)大模型、訓(xùn)練Transformer模型或是搞LoRA微調(diào)。它由蘋果官方發(fā)布,風(fēng)格與PyTorch相似,不過并不基于任何已有框架實現(xiàn)。LeCun等大佬紛紛趕來點贊轉(zhuǎn)發(fā)。英偉達高級AI科學(xué)家Jim Fan贊嘆稱:這應(yīng)該是目前蘋果在開源AI開源上最大的動作了。甚至還有網(wǎng)友動起了iPhone上A芯的念頭(手動狗頭)所以,這個框架究竟長啥樣?參考多個ML框架設(shè)計這個新框架名叫MLX,有探索機器學(xué)習(xí)(ml-explore)的意思。從功能來看,MLX主要有以下幾點特性:API熟悉(包括C++ API、類似NumPy的Python API以及一些高級功能包近似于PyTorch的API)、可組合函數(shù)變換、惰性計算、動態(tài)圖構(gòu)建、多設(shè)備可用、統(tǒng)一內(nèi)存。框架作者A…
原文鏈接:點此閱讀原文:蘋果大模型最大動作:開源M芯專用ML框架,能跑70億大模型
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...