標簽:圖像

無需訓練,這個新方法實現了生成圖像尺寸、分辨率

機器之心專欄 機器之心編輯部近日,來自香港中文大學 - 商湯科技聯合實驗室等機構的研究者們提出了FouriScale,該方法在利用預訓練擴散模型生成高分辨率圖像...
閱讀原文

Scaling Laws 又失靈了?谷歌新研究:擴散模型不是越大越好

夕小瑤科技說 原創作者 | Zicy近年來,模型規模呈現出愈來愈大的趨勢,越來越多的人相信“力大磚飛”。 OpenAI 雖然沒有公布Sora的訓練細節,但在Sora的技術報...
閱讀原文

揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯合NUS提出LLaVA-UHD

機器之心專欄 機器之心編輯部GPT-4V 的推出引爆了多模態大模型的研究。GPT-4V 在包括多模態問答、推理、交互在內的多個領域都展現了出色的能力,成為如今最領...
閱讀原文

二次元專用超分AI模型APISR:在線可用,入選CVPR

機器之心報道 編輯:Panda《龍珠》、《神奇寶貝》、《新世紀福音戰士》等上個世紀開播的動漫是很多人童年回憶的一部分,它們曾給我們帶來了充滿了熱血、友情...
閱讀原文

該死,這糟糕的心動感,AI殺瘋了!

大數據文摘受權轉載自Jack Cui 推薦三個AI工具。 一、Champ 三維參數導引下可控一致的人體圖像動畫生成項目。只需要一張照片,就能讓照片里的人物動起來。 給...
閱讀原文

拒絕白人與亞洲人同框,Meta圖像生成器的「歧視」,被人挖出來了

機器之心報道 編輯:杜偉AI 生成工具的偏見何時休? 在人工智能構筑的世界中,AI 有時會像人一樣存在著某種偏見或傾向性。比如對于大語言模型而言,由于訓練...
閱讀原文

值得你花時間看的擴散模型教程,來自普渡大學

機器之心報道 編輯:小舟、澤南Diffusion 不僅可以更好地模仿,而且可以進行「創作」。 擴散模型(Diffusion Model)是圖像生成模型的一種。有別于此前 AI 領...
閱讀原文

首個開源世界模型!百萬級上下文,長視頻理解吊打GPT-4,UC伯克利華人一作

新智元報道編輯:alan 【新智元導讀】來自UC berkeley的研究人員開源了首個世界模型,多模態性能優秀,長視頻理解吊打GPT-4,同時將上下文長度增加到百萬級別...
閱讀原文

騰訊開源視頻生成新工具,論文還沒發先上代碼的那種

西風 發自 凹非寺量子位 | 公眾號 QbitAI先上代碼再發論文,騰訊新開源文生視頻工具火了。 名為MuseV,主打基于視覺條件并行去噪的無限長度和高保真虛擬人視...
閱讀原文

擴散模型攻克算法難題,AGI不遠了!谷歌大腦找到迷宮最短路徑

新智元報道編輯:桃子 【新智元導讀】解決最短路徑算法,也能被擴散模型完成。「擴散模型」也能攻克算法難題? 一位博士研究人員做了一個有趣的實驗,用「離...
閱讀原文

一眼假!GPT4V可有效識別DeepFake圖像!

夕小瑤科技說 原創作者 | 芒果引言:AI時代的信息真偽辨識在人工智能迅猛發展的今天,我們面臨著前所未有的信息真偽辨識挑戰。AI技術,尤其是深度學習模型,...
閱讀原文

可編輯的DALL·E 3要來了?一句話就能PS圖片

機器之心報道 編輯:陳萍OpenAI 從未放慢前進的腳步,DALL?E 3 將支持對生成后的圖片進行再次編輯。可編輯的 DALL?E 3 難道要來了? 在 OpenAI 剛剛更新的...
閱讀原文

上海交大新框架解鎖CLIP長文本能力,多模態生成細節拿捏,圖像檢索能力顯著提升

白交 發自 凹非寺量子位 | 公眾號 QbitAICLIP長文本能力被解鎖,圖像檢索任務表現顯著提升! 一些關鍵細節也能被捕捉到。上海交大聯合上海AI實驗室提出新框架...
閱讀原文

Midjourney角色一致性功能使用報告

智猩猩與智東西將于4月18-19日在北京共同舉辦2024中國生成式AI大會,阿里巴巴通義千問大模型技術負責人周暢,「清華系Sora」生數科技CEO唐家渝,云天勵飛“云...
閱讀原文

Champ首發開源:人體視頻生成新SOTA,5天斬獲1k星,demo可玩

機器之心專欄 機器之心編輯部一張照片 + 一段視頻,就能讓照片活起來!近日,由阿里、復旦大學、南京大學聯合發布的可控人體視頻生成工作 Champ 火爆全網。該...
閱讀原文
1212223242548