標(biāo)簽:本文

CVPR 2024 Highlight | 基于單曝光壓縮成像,不依賴生成模型也能從單張圖像中重建三維場(chǎng)景

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過(guò)去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

首個(gè)基于Mamba的MLLM來(lái)了!模型權(quán)重、訓(xùn)練代碼等已全部開(kāi)源

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過(guò)去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

ICLR 2024 | 聯(lián)邦學(xué)習(xí)攻擊的模型關(guān)鍵層

機(jī)器之心專欄 機(jī)器之心編輯部聯(lián)邦學(xué)習(xí)使多個(gè)參與方可以在數(shù)據(jù)隱私得到保護(hù)的情況下訓(xùn)練機(jī)器學(xué)習(xí)模型。但是由于服務(wù)器無(wú)法監(jiān)控參與者在本地進(jìn)行的訓(xùn)練過(guò)程,參...
閱讀原文

攻陷短視頻后,Sora將需要72萬(wàn)塊H100 GPU

機(jī)器之心報(bào)道 編輯:趙陽(yáng)在被大規(guī)模采用后,Sora 的推理成本將很快超過(guò)訓(xùn)練成本。OpenAI 推出的 Sora 模型能夠在各種場(chǎng)景下生成極其逼真的視頻,吸引了全世界...
閱讀原文

擴(kuò)散模型進(jìn)軍專業(yè)圖層,斯坦福提出LayerDiffuse實(shí)現(xiàn)分層擴(kuò)散,效果直逼商業(yè)網(wǎng)站

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自將門創(chuàng)投 目前,視覺(jué)擴(kuò)散生成模型(如Stable Diffusion等)在常規(guī)圖像生成任務(wù)上獲得了非常好的效果,但是在內(nèi)容制作的專業(yè)領(lǐng)域,例如對(duì)...
閱讀原文

討論下一個(gè)token預(yù)測(cè)時(shí),我們可能正在走進(jìn)陷阱

機(jī)器之心報(bào)道 編輯:趙陽(yáng)自香農(nóng)在《通信的數(shù)學(xué)原理》一書(shū)中提出「下一個(gè) token 預(yù)測(cè)任務(wù)」之后,這一概念逐漸成為現(xiàn)代語(yǔ)言模型的核心部分。最近,圍繞下一個(gè) ...
閱讀原文

CNN、Transformer、Uniformer之外,我們終于有了更高效的視頻理解技術(shù)

機(jī)器之心報(bào)道 編輯:Rome Rome視頻理解因大量時(shí)空冗余和復(fù)雜時(shí)空依賴,同時(shí)克服兩個(gè)問(wèn)題難度巨大,CNN 和 Transformer 及 Uniformer 都難以勝任,Mamba 是個(gè)...
閱讀原文

拖拽P圖技術(shù)又升級(jí)了:StableDrag更穩(wěn)、更準(zhǔn),南大、騰訊聯(lián)合打造

機(jī)器之心報(bào)道 編輯:杜偉、陳萍去年 5 月,動(dòng)動(dòng)鼠標(biāo)就能讓圖片變「活」得研究 DragGAN 吸引了 AI 圈的關(guān)注。通過(guò)拖拽,我們可以改變并合成自己想要的圖像,比...
閱讀原文

全面超越ViT,美團(tuán)、浙大等提出視覺(jué)任務(wù)統(tǒng)一架構(gòu)VisionLLAMA

機(jī)器之心專欄 機(jī)器之心編輯部半年多來(lái),Meta 開(kāi)源的 LLaMA 架構(gòu)在 LLM 中經(jīng)受了考驗(yàn)并大獲成功(訓(xùn)練穩(wěn)定、容易做 scaling)。 沿襲 ViT 的研究思路,我們能...
閱讀原文

拆解一下字節(jié)的燒錢工作,MegaScale!

智猩猩和智東西發(fā)起主辦的2024中國(guó)生成式AI大會(huì)將于4月18-19日在北京舉辦。主會(huì)場(chǎng)將進(jìn)行開(kāi)幕式、大模型專場(chǎng)、AI Infra專場(chǎng)和AIGC應(yīng)用專場(chǎng);分會(huì)場(chǎng)將進(jìn)行具身...
閱讀原文

RAG還是微調(diào)?微軟出了一份特定領(lǐng)域大模型應(yīng)用建設(shè)流程指南

機(jī)器之心報(bào)道 編輯:rome檢索增強(qiáng)生成(RAG)和微調(diào)(Fine-tuning)是提升大語(yǔ)言模型性能的兩種常用方法,那么到底哪種方法更好?在建設(shè)特定領(lǐng)域的應(yīng)用時(shí)哪種...
閱讀原文

GPT-4V只能排第二!華科大等發(fā)布多模態(tài)大模型新基準(zhǔn):五大任務(wù)14個(gè)模型全面測(cè)評(píng)

新智元報(bào)道編輯:LRS 好困 【新智元導(dǎo)讀】華中科技大學(xué)聯(lián)合華南理工大學(xué)、北京科技大學(xué)等機(jī)構(gòu)的研究人員對(duì)14個(gè)主流多模態(tài)大模型進(jìn)行了全面測(cè)評(píng),涵蓋5個(gè)任務(wù)...
閱讀原文

根據(jù)模型輸出反轉(zhuǎn)LLM輸入提示,讓惡意攻擊無(wú)處可藏

大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自將門創(chuàng)投 作者:seven_ 近一段時(shí)間以來(lái),工業(yè)界和學(xué)術(shù)界都對(duì)大型語(yǔ)言模型(LLM)的內(nèi)部運(yùn)行機(jī)理進(jìn)行了深入的研究和探索。這種基礎(chǔ)理論研...
閱讀原文

47年前經(jīng)典影片另類重制,從宇宙到原子皆是生成

機(jī)器之心報(bào)道 作者:大盤雞從廣角視圖到微距拍攝,每一步由你來(lái)決定。 以躺在草坪上的男人為中心,將鏡頭畫(huà)面按照 10 倍的比例不斷擴(kuò)展,你將看到一億光年外...
閱讀原文

驍龍888實(shí)時(shí)運(yùn)行,美團(tuán)、浙大等打造全流程移動(dòng)端多模態(tài)大模型MobileVLM

機(jī)器之心報(bào)道 機(jī)器之心編輯部大模型涌向移動(dòng)端的浪潮愈演愈烈,終于有人把多模態(tài)大模型也搬到了移動(dòng)端上。近日,美團(tuán)、浙大等推出了能夠在移動(dòng)端部署的多模態(tài)...
閱讀原文
1234