Sora 團隊負責人 Aditya Ramesh 對話謝賽寧丨壓縮一切！視覺與語言模態的融合?

AIGC動態1年前 (2024)發布大數據文摘

AIGC動態歡迎閱讀

原標題：Sora 團隊負責人 Aditya Ramesh 對話謝賽寧丨壓縮一切！視覺與語言模態的融合?
關鍵字：模型,圖像,文本,語言,政策
文章來源：大數據文摘
內容字數：0字

內容摘要：

大數據文摘受權轉載自智源社區
2024 年 6 月 14 日，一年一度的智源大會又迎來重磅嘉賓。
當紅視頻生成大模型「Sora」團隊的負責人Aditya Ramesh在2024智源大會開幕式上發表了題為「Language as the Scaffolding for Visual Intelligence」的主旨演講。他介紹了生成式建模領域近年來的發展歷程以及未來的前進方向，分享了 OpenAI 從研發 DALL·E、iGPT、CLIP 到 Sora 的一次次研究指導思想的轉變，講述其團隊為何一步步將生成式模型做向極致。站在人工智能 3.0 的拐點，Aditya Ramesh 的寶貴經驗具有巨大的啟發意義。
下面是智源社區對 Aditya Ramesh 演講主要內容的編譯：
大模型初探：DALL·E——擴展模型規模的啟示
2021 年 2 月，我們發布了著名的「文生圖」人工智能系統 DALL·E，它是一個同時使用文本和量化壓縮后的圖像以自回歸方式訓練的 Transformer 模型。該系統可以將文字描述映射為量化的創作各種風格的逼真圖像。之所以決定開展該項目，是因為我們看到使用 Tra

原文鏈接：Sora 團隊負責人 Aditya Ramesh 對話謝賽寧丨壓縮一切！視覺與語言模態的融合?