AIGC動態歡迎閱讀
原標題:谷歌Genie爆打Sora,基礎世界模型AGI來了?一張草圖即生一個世界,通才智能體迎來新
關鍵字:模型,動作,視頻,世界,研究人員
文章來源:新智元
內容字數:9400字
內容摘要:
新智元報道編輯:編輯部
【新智元導讀】真正的「基礎世界模型」誕生了!谷歌團隊發布110億參數Genie「精靈」,從一張圖片就能創造出可玩的虛擬世界,動作可控碾壓Sora。網友驚嘆,AI已經殺到視頻游戲領域了。就在昨天,谷歌DeepMind重磅發布了一個基礎世界模型——Genie「精靈」。
從一個圖像,一張照片,一個草圖中,它就能生成一個無窮無盡的世界。
當紅炸子雞Sora雖然創造了令人驚嘆的場景,但它們的動作并非可控。
而Genie將成為游戲規則的改變者,創造的虛擬場景可以像電子游戲一樣進行互動。
論文地址:https://arxiv.org/abs/2301.07608
Genie的瘋狂之處在于,學習了20萬小時的未標注互聯網視頻,無需監督即可訓練。
無需任何動作標注,便可以確定誰是主角,并讓用戶能夠在生成的世界中對其控制。
憑借110億參數,Genie確立了自己作為基礎世界模型的地位
具體來說,它是通過潛動作(latent action)模型、視頻分詞器,以及自回歸動態模型三大核心組件來實現的。
由此產生的學習潛動作空間,不僅使用戶交互成為可能,而且還有助于訓練智能體模仿看不見的
原文鏈接:谷歌Genie爆打Sora,基礎世界模型AGI來了?一張草圖即生一個世界,通才智能體迎來新
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...