標簽:性能
1塊3090就能訓7B大模型,山東大學低帶寬低顯存訓練法,解決顯卡限購卡脖子
夕小瑤科技說 原創作者 | 謝年年 大模型的全參數微調對資源要求非常高,當前業界更傾向于采用LoRA,Parallel Adapter等參數高效微調(PEFT)方法,通過添加只...
吳恩達團隊新作:多模態多樣本上下文學習,無需微調快速適應新任務
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
大模型壓縮量化方案怎么選?無問芯穹Qllm-Eval量化方案全面評估:多模型、多參數、多維度
機器之心發布 作者:李師堯(無問芯穹TechView)基于 Transformer架構的大型語言模型在各種基準測試中展現出優異性能,但數百億、千億乃至萬億量級的參數規模...
2.5%KV緩存保持大模型90%性能,大模型金字塔式信息匯聚模式探秘|開源
蔡澤凡 投稿量子位 | 公眾號 QbitAI用KV緩存加速大模型的顯存瓶頸,終于迎來突破。 北大、威斯康辛-麥迪遜、微軟等聯合團隊提出了全新的緩存分配方案,只用2....
蘋果智能揭秘:神奇背后的尖端人工智能技術
點擊上方藍字關注我們“蘋果在WWDC上推出個人智能系統Apple Intelligence,集成至平臺,優化移動設備性能,專注日常任務,與OpenAI合作處理復雜請求。蘋果公司...
FineWeb技術報告出爐!揭秘HuggingFace規模最大、質量最高預訓練數據集
新智元報道編輯:Mindy 【新智元導讀】從大規模網絡爬取、精細過濾到去重技術,通過FineWeb的技術報告探索如何打造高質量數據集,為大型語言模型(LLM)預訓...
原作者帶隊,LSTM卷土重來之Vision-LSTM出世
機器之心報道 編輯:鴨梨、蛋醬與 DeiT 等使用 ViT 和 Vision-Mamba (Vim) 方法的模型相比,ViL 的性能更勝一籌。 AI 領域的研究者應該還記得,在 Transforme...
全球開源新王Qwen2-72B誕生,碾壓Llama3-70B擊敗國產閉源模型!AI圈大佬轉瘋了
新智元報道編輯:編輯部 【新智元導讀】一夜之間,全球最強開源模型再次易主。萬眾矚目的Qwen2-72B一出世,火速殺進開源LLM排行榜第一,美國最強開源模型Llam...
英特爾放大招:新制程、能效核一起上,144核的至強6,性能成倍提升
機器之心發布 機器之心編輯部今日,英特爾推出英特爾? 至強? 6能效核處理器,每個 CPU 擁有多達 144 個內核,機架密度提高達3倍1,以高性能、高密度、高能效...
iQOO Pad2 Pro:卓爾不群的巔峰性能,從容應對不止一面
標題: iQOO Pad2 Pro:卓爾不群的巔峰性能,從容應對不止一面 摘要: 工作學習電競娛樂多面手。 到底是誰在說, Android 平板的性能,夠用就好? 但 iQOO 電...
首次證實白盒Transformer可擴展性!馬毅教授CRATE-α:鯨吞14億數據,性能穩步提升
新智元報道編輯:LRS 【新智元導讀】CRATE-α是一種新型Transformer架構變體,通過設計改進提升了模型的可擴展性、性能和可解釋性,CRATE-α-Base在ImageNet分...
AI手機PC大爆發,Arm從軟硬件到生態發力,打造行業AI百寶箱
生成式AI,Arm拋出AI軟硬件加速全家桶。 作者|云鵬 編輯|漠影 隨著“Gen-AI”時代的到來,AI手機、AI PC等關鍵核心移動設備都在快速與生成式AI結合,越來越多的...
英特爾牙膏擠爆:功耗降40%、AI算力120TOPS,你的下一代筆記本沒有內存條了
西風 發自 凹非寺量子位 | 公眾號 QbitAI英特爾為了AI,再次做出重大架構變革: 像手機一樣搞起SoC(系統級芯片),你的下一臺筆記本不會再有獨立內存條。 剛...
蘇媽殺瘋了:移動端最強NPU算力達50TOPS,最強AI芯片挑戰英偉達
機器之心報道 作者:杜偉、亞鸝你方唱罷我登場。一年一度的 Computex 科技大會成為了 GPU 廠商們秀肌肉的舞臺,其中當屬英偉達和 AMD 最為亮眼。英偉達現場拿...
挑戰英偉達,AMD官宣年更芯片!新款MI325X重磅發布,比H200快1.3倍
新智元報道編輯:庸庸 喬楊 【新智元導讀】AMD在Computex主題演講上大出風頭,推出了首批Zen 5處理器,包括臺式機用Ryzen 9000 CPU和筆記本電腦用Ryzen AI 30...
粵公網安備 44011502001135號