標簽:視角
讓智能體像孩子一樣觀察別人學習動作,跨視角技能學習數據集EgoExoLearn來了
機器之心專欄 機器之心編輯部在探索人工智能邊界時,我們時常驚嘆于人類孩童的學習能力 —— 可以輕易地將他人的動作映射到自己的視角,進而模仿并創新。當我們...
從第一人稱視角理解世界,多模態模型離我們還有多遠?| CVPR 2024
大數據文摘受權轉載自將門創投 目前很多評測工作探究視覺語言大模型在不同維度上的能力,但都忽視了真實世界中非常重要的一點:未來作為智能體或機器人的大腦...
大型多視角高斯模型LGM:5秒產出高質量3D物體,可試玩
機器之心專欄 機器之心編輯部為滿足元宇宙中對 3D 創意工具不斷增長的需求,三維內容生成(3D AIGC)最近受到相當多的關注。并且,3D 內容創作在質量和速度方...
只需2分鐘,單視圖3D生成又快又好!北大等提出全新Repaint123方法
新智元報道編輯:LRS 好困 【新智元導讀】將2D擴散模型的強大圖像生成能力與再繪策略的紋理對齊能力結合起來,Repaint123能夠在2分鐘內從零開始生成具有多視...
1張圖2分鐘轉3D!紋理質量、多視角一致性新SOTA|北大出品
張俊武 唐振宇 投稿量子位 | 公眾號 QbitAI只需兩分鐘,玩轉圖片轉3D! 還是高紋理質量、多視角高一致性的那種。 不管是什么物種,輸入時的單視圖圖像還是這...
用擴散模型監督NeRF,清華文生3D新方法成新SOTA
清華王霞投稿量子位 | 公眾號 QbitAI用文字合成3D圖形的AI模型,又有了新的SOTA! 近日,清華大學劉永進教授課題組提出了一種基于擴散模型的文生3D新方式。 ...
材質界的ImageNet,大規模6維材質實拍數據庫OpenSVBRDF發布|SIGGRAPH Asia
機器之心專欄機器之心編輯部在計算圖形學領域,材質外觀刻畫了真實物體與光線之間的復雜物理交互,通常可表達為隨空間位置變化的雙向反射分布函數(Spatially...
Stable Video Diffusion問世!3D合成功能引關注,網友:進步太快
西風 發自 凹非寺量子位 | 公眾號 QbitAIStable Diffusion官方終于對視頻下手了——發布生成式視頻模型Stable Video Diffusion(SVD)。Stability AI官方博客顯...
AI玩推理桌游一眼識破騙局!清華通院聯合推出心智理論新框架,6個指標評估表現均明顯優于思維鏈
阿瓦隆 發自 凹非寺量子位 | 公眾號 QbitAI清華自動化系團隊聯合北京通用人工智能研究院,讓幾個AI智能體玩起了桌游!游戲名叫阿瓦隆,是一個策略性的社交推...
清華&通院讓AI智能體成功識破謊言!ReCon框架玩轉「阿瓦隆」,三思后行+換位思考
新智元報道編輯:LRS【新智元導讀】讓AI智能體學會「三思而后行」和「換位思考」,實現對虛假欺騙信息的甄別與應對,為通用人工智能增加安全屏障。大語言模型...
自動駕駛數據不用愁!港中文等發布MagicDrive:日夜、雨晴、多視角全覆蓋,人、物位置隨意變更
新智元報道編輯:LRS【新智元導讀】MagicDrive可以細粒度生成高保真、多相機街景,可以隨意變換天氣、光照條件以及人物位置,海量自動駕駛數據觸手可及!在深...
ReCon框架幫助AI大模型識破謊言,來看智能體如何在阿瓦隆游戲中應對
機器之心專欄機器之心編輯部讓 AI 智能體學會「三思而后行」和「換位思考」,實現對虛假欺騙信息的甄別與應對,為通用人工智能增加安全屏障。大語言模型(Lar...
港科大譚平團隊突破3D生成領域關鍵性問題,讓多頭怪不再出現
機器之心專欄機器之心編輯部生成模型在圖像生成領域取得了巨大的成功,但將這一技術擴展到 3D 領域一直面臨著重重挑戰。典型的多頭怪問題,即文本生成3D中多...
文生3D模型大突破!MVDream重磅來襲,一句話生成超逼真三維模型
新智元報道編輯:拉燕【新智元導讀】文生3D模型進步!分數蒸餾采樣下的MVDream,真的有這么神奇嗎?真的有。不得了了!現在只用打幾個字就能創造精美、高質量...
NeurIPS 2023 Spotlight|高質量多視角圖像生成,完美復刻場景材質!SFU等提出MVDiffusion
新智元報道編輯:LRS 好困【新智元導讀】不怕多視角圖像變化大,MVDiffusion整合圖片全局意識,內容一致性更高!逼真的圖像生成在虛擬現實、增強現實、視頻游...
12