標簽:高效
小模型卷起來了:Mistral聯合英偉達開源12B小模型,128k上下文
機器之心報道 機器之心編輯部小模型,正在成為 AI 巨頭的新戰場。今天凌晨,OpenAI 突然發布了 GPT-4o 的迷你版本 ——GPT-4o mini。這個模型替代了原來的 GPT-...
基于LoRA微調多模態大模型一文解析
7月16日19點,「智猩猩AI新青年講座」第244講將開講。上海交通大學和寧波東方理工大學聯合培養博士生徐良將主要講解通用的3D人體動作生成框架ActFormer和人體...
清華汪玉教授團隊支招:如何把“大”模型部署到“小”設備上 | Q福利
2024 年,由 AI 驅動的 GPT-4o 等應用產品爆紅。這些熱門產品的廣闊應用前景令人振奮,吸引了大量資源投入 AI 的算法研究、數據清洗、算力等方面的基礎建設中...
給大家介紹我的新工具人,夸克AI搜索
NO.1AI時代的搜索變身搜索引擎,長期占據互聯網“鐵王座”。 AI迅猛崛起后,風向有變。 有人猜測: “搜索引擎的黃金時代可能要結束了。”然而,這事沒那么簡單,...
Meta AI推出適用于移動設備的緊湊型語言模型
點擊上方藍字關注我們“Meta AI 推出 MobileLLM,一種為移動設備設計的高效語言模型。該模型通過優化參數,實現了與更大模型相當的性能,推動了 AI 模型小型化...
面壁 WAIC 新發布:新一代高效低能耗架構面壁小鋼炮、一鍵開發大模型 APP 的全棧工具集
作者 | 蔡芳芳 7 月 5 日,面壁智能聯合創始人、首席科學家劉知遠在 WAIC 2024 “模型即服務(Mass)加速大模型應用落地”論壇進行了《大模型時代的摩爾定律,...
WAIC 最具技術想象力成果發布:新架構面壁小鋼炮又一次驗證并加速了面壁定律
在非共識階段打「先手」。作者丨王悅 編輯丨陳彩嫻 2020 年,1750 億參數規模的 GPT-3 問世。彼時,完整訓練 1750 億參數的模型需要 3.14E11(TFLOPS)的每秒...
大模型性能摻水嚴重?北大交出答卷:交互評估+動態出題,死記硬背也沒用 | ACL 2024
新智元報道編輯:LRS 【新智元導讀】當前大語言模型(LLM)的評估方法受到數據污染問題的影響,導致評估結果被高估,無法準確反映模型的真實能力。北京大學等...
最難「討好」的消費者,竟然都被AIGC征服了?
說到「營銷互動」,你會想到什么? 從傳統媒介到互聯網時代,互動營銷都在行業中占據一席之地。具體形式可能是報紙一角的創意廣告,可能是花樣百出的 H5 或微...
擊敗Gemini-1.5-Pro、GPT-4V,從容大模型多模態能力躋身全球前三
機器之心報道 機器之心編輯部近日,云從科技從容大模型在綜合評測權威平臺 OpenCompass 的多模態評測領域中取得重大進展。 最新評測結果顯示,云從科技的從容...
單張A100全精度推理!谷歌明星開源模型Gemma 2上新9B/27B,挑戰3140億Grok-1
新智元報道編輯:耳朵 【新智元導讀】昨晚,谷歌正式開源了自家最強的開源模型Gemma 2,直指為全球范圍研究開發者提供實用部署工具。就在昨晚,谷歌的明星開...
英偉達開源合成數據大模型:獎勵模型,超過GPT-4 Turbo
直播預告 | 6月18日上午10點,「智猩猩AI新青年講座」第240講正式開講,邀請到德州大學奧斯汀分校劉星超博士將直播講解《利用直線概率流加速Stable Diffusion...
英偉達開源最強通用模型Nemotron-4 340B
機器之心報道 機器之心編輯部性能超越 Llama-3,主要用于合成數據。英偉達的通用大模型 Nemotron,開源了最新的 3400 億參數版本。 本周五,英偉達宣布推出 N...
萬字綜述大模型高效推理:無問芯穹與清華、上交最新聯合研究全面解析大模型推理優化
機器之心發布 作者:寧雪妃、周紫軒(無問芯穹TechView)近年來,大語言模型(Large Language Models, LLMs)受到學術界和工業界的廣泛關注,得益于其在各種...
重磅!斯坦福 AI 團隊被曝抄襲中國大模型開源成果,輿論開始發酵
美國也有投機分子。作者 | 西西 編輯 | 陳彩嫻 過去一年,中國大模型一直被貼上「追趕美國」的標簽,但近日,推特上卻有人曝出:美國斯坦福大學的一個 AI 團...
粵公網安備 44011502001135號