標簽:分辨率
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業(yè)~AI生成影視解說,半個月漲粉變現(xiàn)3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發(fā)現(xiàn)...
擴散模型失寵?端側(cè)非自回歸圖像生成基礎(chǔ)模型Meissonic登場,超越SDXL!
新智元報道編輯:LRST 【新智元導(dǎo)讀】剛剛,一款專為消費級顯卡設(shè)計的全新非自回歸掩碼圖像建模的文本到圖像生成模型——Meissonic發(fā)布,標志著圖像生成即將進...
ECCV 2024收錄!曠視提出無需訓(xùn)練的更高分辨率圖像生成框架HiDiffusion | 一作、高級研究員張慎主講預(yù)告
在圖像生成領(lǐng)域,高分辨率圖像的生成一直是一個具有挑戰(zhàn)性的工作。Stable Diffusion等強大的預(yù)訓(xùn)練擴散模型目前可以生成1024x1024像素的高質(zhì)量圖像。但生成更...
長短大小樣樣精通!原始分辨率、超長視頻輸入:更靈活的全開源多模態(tài)架構(gòu)Oryx
AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學(xué)術(shù)...
字節(jié)豆包全新圖像Tokenizer:生成圖像最低只需32個token,最高提速410倍
AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學(xué)術(shù)...
超越CVPR 2024方法,DynRefer在區(qū)域級多模態(tài)識別任務(wù)上,多項SOTA
機器之心發(fā)布 機器之心編輯部為了實現(xiàn)高精度的區(qū)域級多模態(tài)理解,本文提出了一種動態(tài)分辨率方案來模擬人類視覺認知系統(tǒng)。本文作者來自于中國科學(xué)院大學(xué)LAMP實...
把整個地球裝進神經(jīng)網(wǎng)絡(luò),北航團隊推出全球遙感圖像生成模型
克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAI北航的研究團隊,用擴散模型“復(fù)刻”了一個地球? 在全球的任意位置,模型都能生成多種分辨率的遙感圖像,創(chuàng)造出豐富...
4倍內(nèi)存效率,生成和超分雙SOTA!清華&智譜AI發(fā)布最新Inf-DiT模型
直播預(yù)告 | 5月28日10點,「智猩猩AI新青年講座」第236講正式開講,密歇根大學(xué)安娜堡分校在讀博士生張揮杰將直播講解《利用多級框架和多解碼器架構(gòu)提高擴散模...
今日arXiv最熱CV大模型論文:國產(chǎn)開源視覺大模型InternVL 1.5發(fā)布,趕超GPT-4V水準
夕小瑤科技說 原創(chuàng)作者 | 墨墨2023年9月,OpenAI發(fā)布了多模態(tài)大模型GPT-4V,開啟了多模態(tài)研究熱潮。短短8個月時間內(nèi),閉源模型如Gemini系列, Qwen-VL-Max,開...
DiT架構(gòu)大一統(tǒng):一個框架集成圖像、視頻、音頻和3D生成,可編輯、能試玩
機器之心報道 編輯:杜偉、大盤雞基于 Diffusion Transformer(DiT)又迎來一大力作「Flag-DiT」,這次要將圖像、視頻、音頻和 3D「一網(wǎng)打盡」。今年 2 月初...
超分辨率專題 | 3 種方法、4 個教程、10 個數(shù)據(jù)集,一文 Get 核心知識點
作者:十九 編輯:李寶珠,三羊 超分辨率能夠克服或補償由于圖像采集系統(tǒng)、采集環(huán)境本身限制而導(dǎo)致的成像模糊、圖像質(zhì)量低下等問題,提升圖像分辨率,為特征...
在線教程|二次元的福音!一鍵部署APISR,動漫畫質(zhì)飛躍升級
作者:十九 編輯:李寶珠,三羊 APISR 不僅可以恢復(fù)并增強低質(zhì)量、低分辨率的動漫圖像和視頻源,還能處理各種圖像退化問題(如模糊、噪聲、壓縮偽影等),提...
上海AI Lab開源首個可替代GPT-4V的多模態(tài)大模型
夕小瑤科技說 原創(chuàng)作者 | 任同學(xué)與開源和閉源模型相比,InternVL 1.5 在 OCR、多模態(tài)、數(shù)學(xué)和多輪對話等 18 個基準測試中的 8 個中取得了最先進的結(jié)果。 上海...
Open-Sora 全面開源升級:支持單鏡頭16s視頻生成和720p分辨率
Open-Sora 在開源社區(qū)悄悄更新了,現(xiàn)在支持單鏡頭長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文本到圖像、文本到視頻、圖像到視頻、...
Open-Sora全面開源升級:支持16s視頻生成和720p分辨率
機器之心發(fā)布 機器之心編輯部Open-Sora 在開源社區(qū)悄悄更新了,現(xiàn)在單鏡頭支持長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文本到圖像...
Open-Sora 全面開源升級:支持 16s 視頻生成和 720p 分辨率
最近,AI 科技評論發(fā)現(xiàn),國產(chǎn)視頻生成模型 Open-Sora 在開源社區(qū)悄悄更新了! 現(xiàn)在支持長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文...
12