標簽:指令
只需將感知推理能力拆分,2B大模型就能戰勝20B!國產新框架高效處理視覺任務
Prism團隊 投稿至 凹非寺量子位 | 公眾號 QbitAI只要把推理和感知能力拆分,2B大模型就能戰勝20B?! 上海AI Lab聯合南京大學、香港中文大學等機構,共同推出...
8B尺寸達到GPT-4級性能!北大等提出醫療專家模型訓練方法
新智元報道編輯:LRST 【新智元導讀】本文研究發現大語言模型在持續預訓練過程中出現目標領域性能先下降再上升的現象。本文引入「穩定性差距」概念來解釋該現...
OpenAI服務受限?別擔心,來這里絲滑玩轉700億參數Llama3,還有100元券免費薅!
新智元報道編輯:編輯部 【新智元導讀】如何無痛玩轉Llama 3,這個手把手教程一看就會!80億參數推理單卡半分鐘速成,微調700億參數僅用4卡近半小時訓完,還...
《Python 機器學習》作者新作:從頭開始構建大型語言模型,代碼已開源
機器之心報道 機器之心編輯部自 ChatGPT 發布以來,大型語言模型(LLM)已經成為推動人工智能發展的關鍵技術。 近期,機器學習和 AI 研究員、暢銷書《Python ...
阿里Qwen2大模型微調入門實戰(附完整代碼)
直播預告 | 6月20日晚7點,「智猩猩機器人新青年講座」第8講正式開講,清華大學THUNLP lab在讀博士胡錦毅將直播講解《面向多模態大模型的具身智能平臺LEGENT...
340B險勝70B,Kimi機器人貼臉“嘲諷”英偉達新開源模型
一水 發自 凹非寺量子位 | 公眾號 QbitAI排名超過Llama-3-70B,英偉達Nemotron-4 340B問鼎競技場最強開源模型! 前兩天,英偉達突然開源了其通用大模型Nemotr...
北大快手攻克復雜視頻生成難題!新框架輕松組合各種細節,代碼將開源
楊靈 投稿自 凹非寺量子位 | 公眾號 QbitAI如何生成高難度、指令超復雜的視頻呢? 北大與快手AI有解了,他們提出新框架VideoTetris,就像拼俄羅斯方塊一樣,...
英偉達開源3400億巨獸,98%合成數據訓出最強開源通用模型!性能對標GPT-4o
新智元報道編輯:Aeneas 好困 【新智元導讀】剛剛,英偉達全新發布的開源模型Nemotron-4 340B,有可能徹底改變訓練LLM的方式!從此,或許各行各業都不再需要...
Mobile-Agent-v2問世,自動化手機操作能力再上新臺階
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
一句話手機自己打車,開源多智能體AI助手,非蘋果手機也能玩
Mobile-Agent團隊 投稿量子位 | 公眾號 QbitAI一句話讓AI自動化操作手機,打個車已經不是難事了。 從官方公布的演示視頻來看,用戶只需要說出目的地,Agent就...
一夜之間,蘋果無數AI工具創業公司!GPT-4o深度整合進蘋果
大數據文摘授權轉載自夕小瑤科技說作者:夕小瑤編輯部 就在剛剛,蘋果發布會WWDC2024官宣了一系列AI相關的重磅升級。 由于這一波AI升級攢的太大了,蘋果甚至...
蘋果下周就要發布的 AI 版 Siri,終極形態或許超出你想象| WWDC24 前瞻
AI Siri 接管應用Siri 已經落后了。 據《紐約報道》,這就是去年蘋果軟件主管 Craig Federighi 和機器學習高管 John Giannandrea 花了幾周測試 ChatGPT 后的...
阿里云重磅發布開源模型Qwen2,性能超Llama3-70及國內眾多閉源模型
整理 | 褚杏娟 6月7日,阿里云更新技術博客,并重磅發布開源模型 Qwen2-72B,性能超過美國最強的開源模型 Llama3-70B,也超過文心 4.0、豆包 pro、混元 pro ...
阿里Qwen2正式開源,性能全方位包圍Llama-3
機器之心報道 編輯:大盤雞Qwen 系列會是眾多大學實驗室新的默認基礎模型嗎? 斯坦福團隊套殼清華大模型的事件不斷發酵后,中國模型在世界上開始得到了更多關...
多模態視覺-語言大模型的架構演進
直播預告 | 6月6日晚7點,「智猩猩AI新青年講座」第238講正式開講,香港大學CVMI Lab在讀博士 楊霽晗將直播講解《V-IRL:根植于真實世界的AI Agents》,歡迎...
粵公網安備 44011502001135號