單圖0.5秒生成3D模型!Stability AI&華人團(tuán)隊(duì)VAST出品

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:?jiǎn)螆D0.5秒生成3D模型!Stability AI&華人團(tuán)隊(duì)VAST出品
關(guān)鍵字:模型,報(bào)告,騰訊,語言,圖像
文章來源:量子位
內(nèi)容字?jǐn)?shù):4248字
內(nèi)容摘要:
允中 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI無需GPU即可部署,0.5秒就能通過單張圖片生成3D模型。
大語言模型風(fēng)暴再起的一晚,3D生成領(lǐng)域也有新開源模型引發(fā)關(guān)注。
二月底,Stability AI悄然換將,新任CTO Christian是圖形學(xué)和機(jī)器視覺大佬。上任不到五天,立刻官宣為開源社區(qū)帶來重磅:和華人團(tuán)隊(duì)VAST聯(lián)合推出3D生成模型TripoSR。
只需短短的0.5秒,TripoSR就能把單張圖片轉(zhuǎn)化為一個(gè)幾何結(jié)構(gòu)完整、材質(zhì)紋理清晰的3D模型,無需任何prompt和專業(yè)知識(shí),甚至不需要依賴GPU。
△圖源Stability AI官網(wǎng)可以看出,不管是人物角色、家裝建筑、食物擺件,TripoSR都能理解和還原。
△圖源TripoSR技術(shù)報(bào)告TripoSR的靈感來源于2023年11月Adobe提出的LRM。
和Sora作為視頻生成模型使用的Transformer架構(gòu)相似,TripoSR和LRM都基于Transformer架構(gòu)。
這種方式將圖像生成3D模型的任務(wù)巧妙地理解為一場(chǎng)跨維度的語言翻譯。想象一下,每一張輸入的圖像都是一種獨(dú)特的語言,而模型的任務(wù),就是將這種圖像語言翻
原文鏈接:單圖0.5秒生成3D模型!Stability AI&華人團(tuán)隊(duì)VAST出品
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破

粵公網(wǎng)安備 44011502001135號(hào)