何愷明新作再戰(zhàn)AI生成:入職MIT后首次帶隊(duì),奧賽雙料金牌得主鄧明揚(yáng)參與
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:何愷明新作再戰(zhàn)AI生成:入職MIT后首次帶隊(duì),奧賽雙料金牌得主鄧明揚(yáng)參與
關(guān)鍵字:模型,建模,量子,損失,團(tuán)隊(duì)
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
夢晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI何愷明入職MIT副教授后,首次帶隊(duì)的新作來了!
讓自回歸模型拋棄矢量量化,使用連續(xù)值生成圖像。并借鑒擴(kuò)散模型的思想,提出Diffusion Loss。
他加入MIT后,此前也參與過另外幾篇CV方向的論文,不過都是和MIT教授Wojciech Matusik團(tuán)隊(duì)等合作的。
這次何愷明自己帶隊(duì),參與者中還出現(xiàn)一個(gè)熟悉的名字:
鄧明揚(yáng),IMO、IOI雙料奧賽金牌得主,在競賽圈人稱“乖神”。
目前鄧明揚(yáng)MIT本科在讀,按入學(xué)時(shí)間推算現(xiàn)在剛好大四,所以也有不少網(wǎng)友猜測他如果繼續(xù)在MIT讀博可能會(huì)加入何愷明團(tuán)隊(duì)。
接下來具體介紹一下,這篇論文研究了什么。
借鑒擴(kuò)散模型,大改自回歸生成傳統(tǒng)觀點(diǎn)認(rèn)為,圖像生成的自回歸模型通常伴隨著矢量量化(Vector Quantization),比如DALL·E一代就使用了經(jīng)典的VQ-VAE方法。
但團(tuán)隊(duì)觀察到,自回歸生成的本質(zhì)是根據(jù)先前的值預(yù)測下一個(gè)token,這其實(shí)與值是離散還是連續(xù)沒啥必然聯(lián)系啊。
關(guān)鍵是要對(duì)token的概率分布進(jìn)行建模,只要該概率分布可以通過損失函數(shù)來測量并用于從中抽取樣本就行。
并且從另一個(gè)
原文鏈接:何愷明新作再戰(zhàn)AI生成:入職MIT后首次帶隊(duì),奧賽雙料金牌得主鄧明揚(yáng)參與
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破