標(biāo)簽:高效

小模型卷起來了:Mistral聯(lián)合英偉達(dá)開源12B小模型,128k上下文

機(jī)器之心報道 機(jī)器之心編輯部小模型,正在成為 AI 巨頭的新戰(zhàn)場。今天凌晨,OpenAI 突然發(fā)布了 GPT-4o 的迷你版本 ——GPT-4o mini。這個模型替代了原來的 GPT-...
閱讀原文

基于LoRA微調(diào)多模態(tài)大模型一文解析

7月16日19點(diǎn),「智猩猩AI新青年講座」第244講將開講。上海交通大學(xué)和寧波東方理工大學(xué)聯(lián)合培養(yǎng)博士生徐良將主要講解通用的3D人體動作生成框架ActFormer和人體...
閱讀原文

清華汪玉教授團(tuán)隊支招:如何把“大”模型部署到“小”設(shè)備上 | Q福利

2024 年,由 AI 驅(qū)動的 GPT-4o 等應(yīng)用產(chǎn)品爆紅。這些熱門產(chǎn)品的廣闊應(yīng)用前景令人振奮,吸引了大量資源投入 AI 的算法研究、數(shù)據(jù)清洗、算力等方面的基礎(chǔ)建設(shè)中...
閱讀原文

給大家介紹我的新工具人,夸克AI搜索

NO.1AI時代的搜索變身搜索引擎,長期占據(jù)互聯(lián)網(wǎng)“鐵王座”。 AI迅猛崛起后,風(fēng)向有變。 有人猜測: “搜索引擎的黃金時代可能要結(jié)束了。”然而,這事沒那么簡單,...
閱讀原文

Meta AI推出適用于移動設(shè)備的緊湊型語言模型

點(diǎn)擊上方藍(lán)字關(guān)注我們“Meta AI 推出 MobileLLM,一種為移動設(shè)備設(shè)計的高效語言模型。該模型通過優(yōu)化參數(shù),實(shí)現(xiàn)了與更大模型相當(dāng)?shù)男阅埽苿恿?AI 模型小型化...
閱讀原文

面壁 WAIC 新發(fā)布:新一代高效低能耗架構(gòu)面壁小鋼炮、一鍵開發(fā)大模型 APP 的全棧工具集

作者 | 蔡芳芳 7 月 5 日,面壁智能聯(lián)合創(chuàng)始人、首席科學(xué)家劉知遠(yuǎn)在 WAIC 2024 “模型即服務(wù)(Mass)加速大模型應(yīng)用落地”論壇進(jìn)行了《大模型時代的摩爾定律,...
閱讀原文

WAIC 最具技術(shù)想象力成果發(fā)布:新架構(gòu)面壁小鋼炮又一次驗(yàn)證并加速了面壁定律

在非共識階段打「先手」。作者丨王悅 編輯丨陳彩嫻 2020 年,1750 億參數(shù)規(guī)模的 GPT-3 問世。彼時,完整訓(xùn)練 1750 億參數(shù)的模型需要 3.14E11(TFLOPS)的每秒...
閱讀原文

大模型性能摻水嚴(yán)重?北大交出答卷:交互評估+動態(tài)出題,死記硬背也沒用 | ACL 2024

新智元報道編輯:LRS 【新智元導(dǎo)讀】當(dāng)前大語言模型(LLM)的評估方法受到數(shù)據(jù)污染問題的影響,導(dǎo)致評估結(jié)果被高估,無法準(zhǔn)確反映模型的真實(shí)能力。北京大學(xué)等...
閱讀原文

最難「討好」的消費(fèi)者,竟然都被AIGC征服了?

說到「營銷互動」,你會想到什么? 從傳統(tǒng)媒介到互聯(lián)網(wǎng)時代,互動營銷都在行業(yè)中占據(jù)一席之地。具體形式可能是報紙一角的創(chuàng)意廣告,可能是花樣百出的 H5 或微...
閱讀原文

擊敗Gemini-1.5-Pro、GPT-4V,從容大模型多模態(tài)能力躋身全球前三

機(jī)器之心報道 機(jī)器之心編輯部近日,云從科技從容大模型在綜合評測權(quán)威平臺 OpenCompass 的多模態(tài)評測領(lǐng)域中取得重大進(jìn)展。 最新評測結(jié)果顯示,云從科技的從容...
閱讀原文

單張A100全精度推理!谷歌明星開源模型Gemma 2上新9B/27B,挑戰(zhàn)3140億Grok-1

新智元報道編輯:耳朵 【新智元導(dǎo)讀】昨晚,谷歌正式開源了自家最強(qiáng)的開源模型Gemma 2,直指為全球范圍研究開發(fā)者提供實(shí)用部署工具。就在昨晚,谷歌的明星開...
閱讀原文

英偉達(dá)開源合成數(shù)據(jù)大模型:獎勵模型,超過GPT-4 Turbo

直播預(yù)告 | 6月18日上午10點(diǎn),「智猩猩AI新青年講座」第240講正式開講,邀請到德州大學(xué)奧斯汀分校劉星超博士將直播講解《利用直線概率流加速Stable Diffusion...
閱讀原文

英偉達(dá)開源最強(qiáng)通用模型Nemotron-4 340B

機(jī)器之心報道 機(jī)器之心編輯部性能超越 Llama-3,主要用于合成數(shù)據(jù)。英偉達(dá)的通用大模型 Nemotron,開源了最新的 3400 億參數(shù)版本。 本周五,英偉達(dá)宣布推出 N...
閱讀原文

萬字綜述大模型高效推理:無問芯穹與清華、上交最新聯(lián)合研究全面解析大模型推理優(yōu)化

機(jī)器之心發(fā)布 作者:寧雪妃、周紫軒(無問芯穹TechView)近年來,大語言模型(Large Language Models, LLMs)受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,得益于其在各種...
閱讀原文

重磅!斯坦福 AI 團(tuán)隊被曝抄襲中國大模型開源成果,輿論開始發(fā)酵

美國也有投機(jī)分子。作者 | 西西 編輯 | 陳彩嫻 過去一年,中國大模型一直被貼上「追趕美國」的標(biāo)簽,但近日,推特上卻有人曝出:美國斯坦福大學(xué)的一個 AI 團(tuán)...
閱讀原文