標簽:圖像
今日arXiv最熱大模型論文:復旦提出基于diffusion的虛擬試衣模型,模特一鍵換裝
夕小瑤科技說 原創作者 | 謝年年僅需上傳模特圖像,便可一鍵換裝,極大提高了用戶網購衣服的效率。 虛擬試衣(Virtual Try-On)作為圖像生成中一個商業價值高...
國產多模態大模型開源!無條件免費商用,性能超Claude 3 Sonnet
簡曈發自 凹非寺量子位 | 公眾號 QbitAI又一個國產多模態大模型開源! XVERSE-V,來自元象,還是同樣的無條件免費商用。 此前元象曾率先發布國內規模最大的開...
元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入
人類獲取的信息83%來自視覺,圖文多模態大模型能感知更豐富和精確的真實世界信息,構建更全面的認知智能,從而向AGI(通用人工智能)邁出更大步伐。 元象今日...
一鍵換裝,讓奧特曼、黃仁勛穿上機器之心的文化衫
機器之心報道 編輯:陳萍、杜偉趕緊來試試吧。AI 幫你來試衣,想穿什么款式一鍵搞定。 精準捕捉服裝細節,衣服紋理、圖案、縫線等屬性高度還原:即使是在戶外...
ICLR 2024 | 跨領域準確進行零樣本異常檢測,浙大等提出AnomalyCLIP
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
一鍵換裝神器爆火,老黃換上抱抱臉T恤,CEO本人:我被替代了,和他爭CEO職位爭不過
西風 發自 凹非寺量子位 | 公眾號 QbitAI笑不活,最新虛擬試穿神器被網友們玩壞了。 黃院士、馬斯克、奧特曼、史密斯等一眾大佬衣服集體被扒。 前有老黃卸下...
端側模型 OctopusV3 來了:手機上的超級助理,性能媲美 GPT-4V 和 GPT-4 的組合?
文章轉載自公眾號:AI前線,本文只做學術/技術分享,如有侵權,聯系刪文。整理 | 傅宇琪 根據一張圖片,能完成什么任務? 想吃菠蘿了?迅速跳轉 Instacart 商...
CVPR 2024 | 擅長處理復雜場景和語言表達,清華&博世提出全新實例分割網絡架構MagNet
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
國產多模態大模型狂飆!顏水成掛帥開源Vitron,圖像/視頻模型割裂問題
未來可探索三大方向:系統架構、用戶交互性、模態能力。 編輯|ZeR0 奔向通用人工智能,大模型又邁出一大步。 智東西4月25日報道,近日,由顏水成教授帶隊,昆...
顏水成掛帥,奠定「通用視覺多模態大模型」終極形態!一統理解/生成/分割/編輯
新智元報道編輯:LRS 【新智元導讀】顏水成團隊聯合新加坡國立、南洋理工大學共同開源了Vitron模型,持從視覺理解到視覺生成、從低層次到高層次的一系列視覺...
加速擴散模型,最快1步生成SOT圖片,字節Hyper-SD開源了
機器之心發布 機器之心編輯部最近,擴散模型(Diffusion Model)在圖像生成領域取得了顯著的進展,為圖像生成和視頻生成任務帶來了前所未有的發展機遇。盡管...
硬控設計人一分鐘,加持大模型的Adobe,PS起來更香了
機器之心報道 機器之心編輯部圖像編輯這一塊,還得看 Adobe。剛剛,Adobe 正式宣布推出新的圖像生成模型 Firefly Image 3,即日起在 Firefly Web 應用程序、A...
又一個GPT-4 級LLM!前谷歌大腦成員初創公司官宣 Reka Core,多模態交互超越 Claude3 Opus
直播預告 | 4月25日早10點,「智猩猩機器人新青年講座」第5講正式開講,谷歌DeepMind實習研究員、上海科技大學助理教授顧家遠將主講《可泛化的具身智能操作技...
CVPR 2024 | 基于MoE的通用圖像融合模型,添加2.8%參數完成多項任務
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
小洞不補,大洞吃苦:西交、麥馬開源全新「拖動式編輯」框架&數據集
新智元報道編輯:LRS 【新智元導讀】最新拖拽式編輯框架GoodDrag主要創新點包括Alternating Drag and Denoising和information-preserving motion supervision...