標(biāo)簽:圖像
VLDB ’25 最后 6 天截稿,58 個頂會信息縱覽;ISPRS 城市分割數(shù)據(jù)集上線
??「頂會」板塊上線 hyper.ai 官網(wǎng)啦!該板塊為大家提供最新最全的CCF A 類計算機頂會信息,包含會議簡介、截稿倒計時、投稿鏈接等。 你是不是已經(jīng)注冊了頂會...
如何用深度學(xué)習(xí)框架 PyTorch 進行數(shù)據(jù)處理? | Q 福利
在深度學(xué)習(xí)處理復(fù)雜任務(wù)時,數(shù)據(jù)預(yù)處理是至關(guān)重要的一環(huán)。PyTorch 作為一款熱門的深度學(xué)習(xí)框架,提供了豐富的數(shù)據(jù)處理工具。通過 PyTorch,開發(fā)者可以輕松地...
4倍內(nèi)存效率,生成和超分雙SOTA!清華&智譜AI發(fā)布最新Inf-DiT模型
直播預(yù)告 | 5月28日10點,「智猩猩AI新青年講座」第236講正式開講,密歇根大學(xué)安娜堡分校在讀博士生張揮杰將直播講解《利用多級框架和多解碼器架構(gòu)提高擴散模...
用基礎(chǔ)模型指導(dǎo)特征傳播,首個泛化型圖像匹配器OmniGlue搞定未見過域
機器之心報道 編輯:杜偉第一個以「泛化」能力為核心設(shè)計原則的可學(xué)習(xí)圖像匹配器來了!對于想要獲取兩張圖像之間的細(xì)粒度視覺對應(yīng)關(guān)系而言,局部圖像特征匹配...
標(biāo)注受限也能識別多標(biāo)簽圖像!中山大學(xué)等發(fā)布異構(gòu)語義轉(zhuǎn)移HST框架 | IJCV 2024
新智元報道編輯:LRT 【新智元導(dǎo)讀】在多標(biāo)簽圖像識別領(lǐng)域中,由于圖像本身和潛在標(biāo)簽類別的復(fù)雜性,收集滿足現(xiàn)有模型訓(xùn)練的多標(biāo)簽標(biāo)注信息往往成本高昂且難...
楊冪+小蘭會是什么樣?中山大學(xué)新AI成果,實現(xiàn)人臉個性化SOTA
皓楠投稿自 凹非寺量子位 | 公眾號 QbitAI只需上傳一張照片,就能瞬間變換身份,獲得高精度個人寫真! 或是科幻電影中的超級英雄,或是穿越時空的復(fù)古角色…… ...
Wegic:收起你那根戳設(shè)計師屏幕的手指
AI 頁面仔呀,聽說過么,Web Designer 呀!省流環(huán)節(jié):Wegic 是一個基于自然語義互動的網(wǎng)站開發(fā) AI 工具,通過簡單的聊天對話進行指令交互,支持零基礎(chǔ)開發(fā)設(shè)...
OpenAI安全系統(tǒng)負(fù)責(zé)人:從頭構(gòu)建視頻生成擴散模型
作者 |Lilian Weng OneFlow編譯 翻譯|楊婷、宛子琳、張雪聃 題圖由SiliconFlow MaaS平臺生成 過去幾年,擴散模型(Diffusion models)在圖像合成領(lǐng)域取得了...
一鍵“搬空”你未來的新家,AI讓買房裝修變簡單了?
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自夕小瑤科技說作者:Richard 大家肯定都幻想過,要是能按自己的想法隨心所欲布置新家該多好啊。租房或買房時看中一處房子,如果能在看房...
Meta發(fā)布多模態(tài)模型Chameleon:34B、類GPT-4o、性能接近GPT-4V
GPT-4o 的橫空出世,再次創(chuàng)立了一個多模態(tài)模型發(fā)展的新范式。OpenAI 將其稱為「首個『原生』多模態(tài)」模型,意味著 GPT-4o 與以往所有的模型,都不盡相同。傳...
爆打多模態(tài)王者 GPT-4V、Gemini Pro!這個小小端側(cè)模型殺瘋了!
夕小瑤科技說 分享多模態(tài)王者 GPT-4V、Gemini Pro ,竟然被一個端側(cè)模型打爆了!而且這個模型還憑強勁實力拿下了全球最強端側(cè)多模態(tài)模型王座! 有圖有真相。...
AI一鍵"搬空"你未來的新家,買房裝修變得簡單了?
夕小瑤科技說 原創(chuàng)作者 | Richard大家肯定都幻想過,要是能按自己的想法隨心所欲布置新家該多好啊。租房或買房時看中一處房子,如果能在看房前先把家具'搬空'...
國產(chǎn)「小鋼炮」一夜干翻巨無霸GPT-4V、Gemini Pro!穩(wěn)坐端側(cè)多模態(tài)鐵王座
新智元報道編輯:桃子 好困 【新智元導(dǎo)讀】殺瘋了!一夜之間,全球最強端側(cè)多模態(tài)模型再次刷新,僅用8B參數(shù),擊敗了多模態(tài)巨無霸Gemini Pro、GPT-4V。而且,...
讓大模型理解手機屏幕,蘋果多模態(tài)Ferret-UI用自然語言操控手機
機器之心報道 編輯:陳萍此次,蘋果提出的多模態(tài)大語言模型(MLLM) Ferret-UI ,專門針對移動用戶界面(UI)屏幕的理解進行了優(yōu)化,其具備引用、定位和推理...
另辟蹊徑挑戰(zhàn)GPT-4o!Meta首發(fā)混合模態(tài)大模型Chameleon
直播預(yù)告 | 5月23日晚7點,「智猩猩機器人新青年講座」第6講正式開講,論文一作、清華大學(xué)在讀博士郭旭東將直播講解《大模型在具身多智能體合作中的研究進展...