<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        手機流暢運行470億大模型:上交大發布LLM手機推理框架PowerInfer-2,提速29倍

        AIGC動態11個月前發布 量子位
        231 0 0

        手機流暢運行470億大模型:上交大發布LLM手機推理框架PowerInfer-2,提速29倍

        AIGC動態歡迎閱讀

        原標題:手機流暢運行470億大模型:上交大發布LLM手機推理框架PowerInfer-2,提速29倍
        關鍵字:神經元,模型,手機,內存,權重
        文章來源:量子位
        內容字數:0字

        內容摘要:


        夢晨 發自 凹非寺量子位 | 公眾號 QbitAI蘋果一出手,在手機等移動設備上部署大模型不可避免地成為行業關注焦點。
        然而,目前在移動設備上運行的模型相對較小(蘋果的是3B,谷歌的是2B),并且消耗大量內存,這在很大程度上限制了其應用場景。
        即使是蘋果,目前也需要與OpenAI合作,通過將云端GPT-4o大模型嵌入到操作系統中來提供能力更強的服務。
        這樣一來,蘋果的混合方案引起了非常多關于數據隱私的討論和爭議,甚至馬斯克都下場討論。
        如果蘋果在操作系統層面集成OpenAI,那么蘋果設備將被禁止在我的公司使用。這是不可接受的安全違規行為。
        既然終端側本地部署大模型的方案既讓手機用戶享受到AI強大的智能,又能保護好自己的隱私安全,為什么蘋果還要冒著隱私的風險選擇聯手OpenAI采用云端大模型呢?主要挑戰有兩點:
        手機內存不夠大:按照大模型的Scaling Law法則,模型參數越大,能力對應的也就越強,這就意味著能力更強的模型對內存的要求越高。
        手機算力不夠強:即使勉強把通過量化等手段把模型塞進手機了,推理速度也慢,適合的應用場景也就非常有限了。
        為了解決上述挑戰,上海交大IPADS實


        原文鏈接:手機流暢運行470億大模型:上交大發布LLM手機推理框架PowerInfer-2,提速29倍

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产av无码专区亚洲av果冻传媒| 亚洲精品无码乱码成人| 亚洲手机中文字幕| 亚洲人成影院午夜网站| 黄页网站在线免费观看| 免费v片在线观看视频网站| 免费人成年轻人电影| 亚洲成熟丰满熟妇高潮XXXXX| 成人免费视频软件网站| 亚洲hairy多毛pics大全| 国产乱子伦精品免费无码专区| 国产精品亚洲天堂| 中文亚洲成a人片在线观看| 亚洲一级毛片在线播放| 天天操夜夜操免费视频| 小说区亚洲自拍另类| 不卡一卡二卡三亚洲| 无码av免费一区二区三区试看| 免费午夜爽爽爽WWW视频十八禁| 免费国产va在线观看| 亚洲欧洲美洲无码精品VA | 亚洲国产精品毛片av不卡在线| 亚洲伊人精品综合在合线| 毛片a级毛片免费播放100| 国产精品亚洲精品爽爽| 亚洲国产一二三精品无码| 91成人免费在线视频| 亚洲国产精品xo在线观看| 好吊妞在线新免费视频| 一区二区三区视频免费观看| 亚洲色图国产精品| 成全视频免费观看在线看| 中文字幕亚洲综合久久菠萝蜜| 99re在线免费视频| 亚洲国产成人久久精品大牛影视| 中文亚洲AV片在线观看不卡| 91成人在线免费观看| 亚洲精品成人网站在线播放| 日本一区二区三区日本免费| 嫩草在线视频www免费观看| 亚洲狠狠婷婷综合久久|