標簽:指令
從BLIP-2到Qwen2-VL,多模態大模型的技術點總結
開講預約導讀原文來自知乎,作者為jewellery,標題為《多模態大模型技術點總結》。作者對BLIP-2、InstructBLIP、LLaVA、LLaVA-1.5、MiniGPT-4、MiniGPT-v2、Q...
如何從零訓練多模態大模型(預訓練方向)
開講預約導讀原文來自知乎,作者為HelloWorld,標題為《LLaVA(六)訓練你自己的多模態模型》。作者詳細介紹了如何從零訓練LLaVA v1.5多模態模型,包括特征對...
斯坦福新作:無指令調優的指令遵循
機器之心報道 編輯:杜偉、陳陳指令調優(Instruction tuning)是一種優化技術,通過對模型的輸入進行微調,以使其更好地適應特定任務。先前的研究表明,指令...
僅用4塊GPU、不到3天訓練出「開源版GPT-4o」,這是國內團隊最新研究
機器之心報道 編輯:小舟、陳陳LLaMA-Omni能夠接收語音指令,同步生成文本和語音響應,響應延遲低至 226ms,低于 GPT-4o 的平均音頻響應延遲 320ms。以 ChatG...
阿里史上最大規模開源發布,超GPT-4o 、Llama-3.1!
文章轉載自公眾號:AIGC開放社區,本文只做學術/技術分享,如有侵權,聯系刪文。 今天凌晨,阿里巴巴官宣了史上最大規模的開源發布,推出了基礎模型Qwen2.5、...
北大提出首個通用指令導航大模型系統 | CoRL 24
董豪團隊 投稿量子位 | 公眾號 QbitAI想象一下當你躺在沙發上,只需要不假思索地說出指令,機器人就能幫你干活,是不是聽起來就十分愜意? 如今這種科幻電影...
LLM對齊綜述|邁向可擴展的大模型自動對齊,中科院軟件所&阿里千問發布
夕小瑤科技說 原創作者 | 中科院軟件所&阿里千問近年來,大模型的高速發展極大地改變了人工智能的格局。對齊(Alignment) 是使大模型的行為符合人類意圖...
RL 是 LLM 的新范式
AGI 正在迎來新范式,RL 是 LLM 的秘密武器。最近幾個月,我們能明顯感受到頭部 AI labs 在形成一些新共識:post training 的重要程度在提高,需要的計算資源...
Meta浙大校友讓評估模型「自學成才」,數據全合成無需人工標注,訓練Llama 3 70B超過405B
新智元報道編輯:喬楊 【新智元導讀】隨著LLM不斷迭代,偏好和評估數據中大量的人工標注逐漸成為模型擴展的顯著障礙之一。Meta FAIR的團隊最近提出了一種使用...
打臉“AI滅絕倫”!研究反駁:大模型涌現能力不會威脅人類生存
大數據文摘受權轉載自學術頭條 大語言模型(LLM)因“涌現能力”(emergent abilities)而擁有了超出人類預期的技能,但也因此讓人類十分忌憚:操縱、欺騙人類...
世界模型又近了?MIT驚人研究:LLM已模擬現實世界,絕非隨機鸚鵡!
新智元報道編輯:編輯部 【新智元導讀】MIT CSAIL的研究人員發現,LLM的「內心深處」已經發展出了對現實的模擬,模型對語言和世界的理解,絕不僅僅是簡單的「...
10人明星團隊煉出首個微調Llama 3.1 405B!角色扮演一秒入戲,代碼全開源
新智元報道編輯:編輯部 【新智元導讀】發布40天后,最強開源模型Llama 3.1 405B等來了微調版本的發布。但不是來自Meta,而是一個專注于開放模型的神秘初創No...
Apple Intelligence存重大安全缺陷,幾行代碼即可攻破!Karpathy發文提醒
新智元報道編輯:耳朵 喬楊 【新智元導讀】Apple Intelligence上線在即,一小哥幾行代碼曝出Apple Intelligence安全缺陷。在2024年全球開發者大會 (WWDC) 上...
香港理工:你精心設計的prompt,很容易被用戶套出來!
夕小瑤科技說 原創作者 | 謝年年自OpenAI的GPT系列及微軟Copilot Studio驚艷登場以來,第三方開發者群體迅速壯大,他們巧妙地設計個性化prompts,并與專業領...
Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密 | ECCV 2024
上海交通大學王德泉課題組 投稿量子位 | 公眾號 QbitAI上海交通大學王德泉教授課題組在最新研究中提出了這樣的一個問題。 設想這樣一個場景:一個幼兒園的小...
粵公網安備 44011502001135號