AIGC動態歡迎閱讀
原標題:大模型的“瘦身”:巨頭逐鹿輕量化大模型 | 大模型一周大事
關鍵字:騰訊,報告,模型,華為,字節跳動
文章來源:AI前線
內容字數:6954字
內容摘要:
大模型的快節奏發展,讓了解最新技術動態、積極主動學習成為每一位從業者的必修課。InfoQ 研究中心期望通過每周更新大模型行業最新動態,為廣大讀者提供全面的行業回顧和要點分析?,F在,讓我們回顧過去一周的大模型重大吧。一、重點發現本周,輕量化和設備端集成成為行業的熱點。微軟的 Phi-3 系列小模型和蘋果的 OpenELM 系列端側小模型的發布,展現了 AI 應用向移動設備端遷移的趨勢。這也預示著未來智能手機和筆記本電腦等設備將能夠處理以往只能在云端或高性能服務器上執行的復雜任務,極大地擴展了端側 AI 的潛力和應用范圍。此外,長文本處理能力的競爭再次增大。Kimi 發布之后,商湯和浪潮分別升級自身模型的長文本能力并展開第二波圍剿。二、具體內容大模型持續更新4 月 23 日,微軟推出了 Phi-3 系列小模型,并發布了其技術報告。值得注意的是,Phi-3-mini 型號,僅擁有 3.8 億參數,已在眾多性能評估標準上超越了 Llama 3 模型。為了促進開源社區的發展,微軟特別設計了與 Llama 系列相兼容的模型架構。
4 月 23 日,商湯科技最近宣布推出了其最新的大模型——日日新
原文鏈接:大模型的“瘦身”:巨頭逐鹿輕量化大模型 | 大模型一周大事
聯系作者
文章來源:AI前線
作者微信:ai-front
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...