30B！每秒100tokens！這是AMD對AI PC的“幻想時間”

AIGC動態1年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：30B！每秒100tokens！這是AMD對AI PC的“幻想時間”
關鍵字：模型,參數,內存,帶寬,精度
文章來源：夕小瑤科技說
內容字數：0字

內容摘要：

夕小瑤科技說原創作者 | 谷雨龍澤隨著AI的高速發展，從去年開始，掛在服務器的云端AI模型已經不能滿足技術發燒友的胃口了，AI PC應運而生。
AI PC就是內嵌個人大模型的電腦，具備更強的算力、更大的存儲空間和更順暢的自然語言交互功能，其核心特征包括CPU、GPU和NPU的本地混合計算架構，能夠支持個人終端和家庭主機/企業主機協同運算。
一直以來，受到硬件條件的限制，AI PC的AI表現一直不是很出色。沒辦法，自己電腦就那點東西，怎么能和一車一車顯卡堆起來的云端大模型比呢？
但是這并不妨礙各大廠家對未來的美好暢想。近期，AMD就對未來的AI PC進行了預測：
未來的AI PC將以每秒100個token的速度運行30B參數模型！
30B和100token/s，意味著什么？AMD預測未來的AI PC將以每秒100個token的速度運行300億參數模型，首個token的延遲達到100毫秒，而現在的技術只能做到70億參數、每秒20個token，首個token的延遲為1至4秒。
▲現有AI PC（Ryzen AI 300）和AMD對AI PC的展望對比300億參數的模型相比當前的70億參數模

原文鏈接：30B！每秒100tokens！這是AMD對AI PC的“幻想時間”

聯系作者

文章來源：夕小瑤科技說
作者微信：xixiaoyaoQAQ
作者簡介：專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員，覆蓋500多家海內外機構投資人，互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠，兼備敏銳的行業嗅覺和洞察深度。商務合作：zym5189

閱讀原文