標簽:圖像
VLDB ’25 最后 6 天截稿,58 個頂會信息縱覽;ISPRS 城市分割數據集上線
?「頂會」板塊上線 hyper.ai 官網啦!該板塊為大家提供最新最全的CCF A 類計算機頂會信息,包含會議簡介、截稿倒計時、投稿鏈接等。 你是不是已經注冊了頂會...
如何用深度學習框架 PyTorch 進行數據處理? | Q 福利
在深度學習處理復雜任務時,數據預處理是至關重要的一環。PyTorch 作為一款熱門的深度學習框架,提供了豐富的數據處理工具。通過 PyTorch,開發者可以輕松地...
4倍內存效率,生成和超分雙SOTA!清華&智譜AI發布最新Inf-DiT模型
直播預告 | 5月28日10點,「智猩猩AI新青年講座」第236講正式開講,密歇根大學安娜堡分校在讀博士生張揮杰將直播講解《利用多級框架和多解碼器架構提高擴散模...
用基礎模型指導特征傳播,首個泛化型圖像匹配器OmniGlue搞定未見過域
機器之心報道 編輯:杜偉第一個以「泛化」能力為核心設計原則的可學習圖像匹配器來了!對于想要獲取兩張圖像之間的細粒度視覺對應關系而言,局部圖像特征匹配...
標注受限也能識別多標簽圖像!中山大學等發布異構語義轉移HST框架 | IJCV 2024
新智元報道編輯:LRT 【新智元導讀】在多標簽圖像識別領域中,由于圖像本身和潛在標簽類別的復雜性,收集滿足現有模型訓練的多標簽標注信息往往成本高昂且難...
楊冪+小蘭會是什么樣?中山大學新AI成果,實現人臉個性化SOTA
皓楠投稿自 凹非寺量子位 | 公眾號 QbitAI只需上傳一張照片,就能瞬間變換身份,獲得高精度個人寫真! 或是科幻電影中的超級英雄,或是穿越時空的復古角色…… ...
Wegic:收起你那根戳設計師屏幕的手指
AI 頁面仔呀,聽說過么,Web Designer 呀!省流環節:Wegic 是一個基于自然語義互動的網站開發 AI 工具,通過簡單的聊天對話進行指令交互,支持零基礎開發設...
OpenAI安全系統負責人:從頭構建視頻生成擴散模型
作者 |Lilian Weng OneFlow編譯 翻譯|楊婷、宛子琳、張雪聃 題圖由SiliconFlow MaaS平臺生成 過去幾年,擴散模型(Diffusion models)在圖像合成領域取得了...
一鍵“搬空”你未來的新家,AI讓買房裝修變簡單了?
大數據文摘授權轉載自夕小瑤科技說作者:Richard 大家肯定都幻想過,要是能按自己的想法隨心所欲布置新家該多好啊。租房或買房時看中一處房子,如果能在看房...
Meta發布多模態模型Chameleon:34B、類GPT-4o、性能接近GPT-4V
GPT-4o 的橫空出世,再次創立了一個多模態模型發展的新范式。OpenAI 將其稱為「首個『原生』多模態」模型,意味著 GPT-4o 與以往所有的模型,都不盡相同。傳...
爆打多模態王者 GPT-4V、Gemini Pro!這個小小端側模型殺瘋了!
夕小瑤科技說 分享多模態王者 GPT-4V、Gemini Pro ,竟然被一個端側模型打爆了!而且這個模型還憑強勁實力拿下了全球最強端側多模態模型王座! 有圖有真相。...
AI一鍵"搬空"你未來的新家,買房裝修變得簡單了?
夕小瑤科技說 原創作者 | Richard大家肯定都幻想過,要是能按自己的想法隨心所欲布置新家該多好啊。租房或買房時看中一處房子,如果能在看房前先把家具'搬空'...
國產「小鋼炮」一夜干翻巨無霸GPT-4V、Gemini Pro!穩坐端側多模態鐵王座
新智元報道編輯:桃子 好困 【新智元導讀】殺瘋了!一夜之間,全球最強端側多模態模型再次刷新,僅用8B參數,擊敗了多模態巨無霸Gemini Pro、GPT-4V。而且,...
讓大模型理解手機屏幕,蘋果多模態Ferret-UI用自然語言操控手機
機器之心報道 編輯:陳萍此次,蘋果提出的多模態大語言模型(MLLM) Ferret-UI ,專門針對移動用戶界面(UI)屏幕的理解進行了優化,其具備引用、定位和推理...
另辟蹊徑挑戰GPT-4o!Meta首發混合模態大模型Chameleon
直播預告 | 5月23日晚7點,「智猩猩機器人新青年講座」第6講正式開講,論文一作、清華大學在讀博士郭旭東將直播講解《大模型在具身多智能體合作中的研究進展...