標(biāo)簽:研究者
單個A100生成3D圖像只需30秒,這是Adobe讓文本、圖像都動起來的新方法
機器之心報道編輯:杜偉、佳琪3D 生成是 AI 視覺領(lǐng)域的研究熱點之一。本文中,來自 Adobe 研究院和斯坦福大學(xué)等機構(gòu)的研究者利用基于 transformer 的 3D 大型...
比「讓我們一步一步思考」這句咒語還管用,提示工程正在被改進
機器之心報道編輯:rome rome大語言模型可以通過元提示執(zhí)行自動提示工程,但由于缺乏足夠的指導(dǎo)以引導(dǎo)大語言模型中的復(fù)雜推理能力,它們的潛力可能沒有完全發(fā)...
GPT-4不會圖形推理?“放水”后準(zhǔn)確率依然只有33%
克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAIGPT-4的圖形推理能力,竟然連人類的一半都不到?美國圣塔菲研究所的一項研究顯示,GPT-4做圖形推理題的準(zhǔn)確率僅有3...
微軟用GPT-4V解讀視頻,看懂電影還能講給盲人聽,1小時不是問題
機器之心報道編輯:Panda、陳萍差不多已經(jīng)掌握語言能力的大模型正在進軍視覺領(lǐng)域,但具有里程碑意義的 GPT-4V 也仍有諸多不足之處,參閱《》。近日,微軟 Azu...
全新近似注意力機制HyperAttention:對長上下文友好、LLM推理提速50%
機器之心報道編輯:大盤雞本文介紹了一項近似注意力機制新研究,耶魯大學(xué)、谷歌研究院等機構(gòu)提出了 HyperAttention,使 ChatGLM2 在 32k 上下文長度上的推理...
讓AI模型成為GTA五星玩家,基于視覺的可編程智能體Octopus來了
機器之心專欄機器之心編輯部電子游戲已經(jīng)成為如今現(xiàn)實世界的模擬舞臺,展現(xiàn)出無限可能。以游戲《俠盜獵車手》(GTA)為例,在 GTA 的世界里,玩家可以以第一...
大模型勇闖洛圣都,加封「GTA五星好市民」!南洋理工、清華等發(fā)布視覺可編程智能體Octopus:打游戲、做家務(wù)全能干
新智元報道編輯:LRS 好困【新智元導(dǎo)讀】讓視覺語言模型(VLM)在模擬的電子世界里游玩是什么體驗?讓Octopus根據(jù)智能體的觀測寫控制代碼,即可實現(xiàn)讓VLM做家...
DeepMind指出「Transformer無法超出預(yù)訓(xùn)練數(shù)據(jù)實現(xiàn)泛化」,但有人投來質(zhì)疑
機器之心報道編輯:蛋醬難道 Transformer注定無法解決「訓(xùn)練數(shù)據(jù)」之外的新問題?說起大語言模型所展示的令人印象深刻的能力,其中之一就是通過提供上下文中...
重新審視Transformer:倒置更有效,真實世界預(yù)測的新SOTA出現(xiàn)了
機器之心報道編輯:大盤雞反轉(zhuǎn) Transformer,變成 iTransformer。Transformer 在時間序列預(yù)測中出現(xiàn)了強大能力,可以描述成對依賴關(guān)系和提取序列中的多層次表...
給大模型評分的基準(zhǔn)靠譜嗎?Anthropic來了次大評估
選自Anthropic機器之心編譯機器之心編輯部在大模型(LLM)盛行的當(dāng)下,評估 AI 系統(tǒng)成為了重要的一環(huán),在評估過程中都會遇到哪些困難,Anthropic 的一篇文章...
GPT-4 做「世界模型」,讓LLM從「錯題」中學(xué)習(xí),推理能力顯著提升
機器之心報道編輯:蛋醬、杜偉從錯誤中學(xué)習(xí),不只是人類可以做到。近日有研究發(fā)現(xiàn),大模型其實也可以借鑒這種思路。這段時間,大語言模型在各種 NLP 任務(wù)中取...
蘋果文生圖大模型亮相:套娃式擴散,支持1024×1024分辨率
機器之心報道編輯:杜偉、小舟習(xí)慣了 Stable Diffusion,如今終于又迎來一個俄羅斯套娃式(Matryoshka)Diffusion 模型,還是蘋果做的。在生成式 AI 時代,擴...
用50多年時間,探索最令人困惑的復(fù)雜性理論知識極限
選自quantamagazine機器之心編譯編輯:Panda證明問題難以解決究竟有多難?元復(fù)雜性(meta-complexity)理論研究者數(shù)十年來一直探究這個問題。近期的一系列研...
在視覺提示中加入「標(biāo)記」,微軟等讓GPT-4V看的更準(zhǔn)、分的更細(xì)
機器之心報道編輯:杜偉、小舟全新視覺提示方法 SoM(Set-of-Mark),讓 OpenAI 多模態(tài)大模型 GPT-4V 在視覺內(nèi)容理解方面有了質(zhì)的提升。最近一段時間,我們見...
解決大模型復(fù)現(xiàn)難、協(xié)作難, 這支95后學(xué)生團隊打造了一個國產(chǎn)AI開源社區(qū)
機器之心報道機器之心編輯部過去十年間,AI 技術(shù)經(jīng)歷了巨大的飛躍,無論是在自然語言處理、圖像識別,還是在更多的創(chuàng)新領(lǐng)域,AI 的影響已無所不在。伴隨著研...
粵公網(wǎng)安備 44011502001135號