AIGC動態歡迎閱讀
原標題:Sora 團隊負責人 Aditya Ramesh 對話謝賽寧丨壓縮一切!視覺與語言模態的融合?
關鍵字:模型,圖像,文本,語言,政策
文章來源:大數據文摘
內容字數:0字
內容摘要:
大數據文摘受權轉載自智源社區
2024 年 6 月 14 日,一年一度的智源大會又迎來重磅嘉賓。
當紅視頻生成大模型「Sora」團隊的負責人Aditya Ramesh在2024智源大會開幕式上發表了題為「Language as the Scaffolding for Visual Intelligence」的主旨演講。他介紹了生成式建模領域近年來的發展歷程以及未來的前進方向,分享了 OpenAI 從研發 DALL·E、iGPT、CLIP 到 Sora 的一次次研究指導思想的轉變,講述其團隊為何一步步將生成式模型做向極致。站在人工智能 3.0 的拐點,Aditya Ramesh 的寶貴經驗具有巨大的啟發意義。
下面是智源社區對 Aditya Ramesh 演講主要內容的編譯:
大模型初探:DALL·E——擴展模型規模的啟示
2021 年 2 月,我們發布了著名的「文生圖」人工智能系統 DALL·E,它是一個同時使用文本和量化壓縮后的圖像以自回歸方式訓練的 Transformer 模型。該系統可以將文字描述映射為量化的創作各種風格的逼真圖像。之所以決定開展該項目,是因為我們看到使用 Tra
原文鏈接:Sora 團隊負責人 Aditya Ramesh 對話謝賽寧丨壓縮一切!視覺與語言模態的融合?
聯系作者
文章來源:大數據文摘
作者微信:BigDataDigest
作者簡介:普及數據思維,傳播數據文化
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...