標簽:圖像

在線教程 | 輕松拿捏莫奈花園、宮崎駿漫畫風格,用 ComfyUI InstantID 打造百變寫真

作者:十九 編輯:李寶珠,三羊 ComfyUI InstantID 能夠賦予用戶極高的自由度與更豐富的創造空間,只需調整連接節點,就能實現個性化定制。擁有高質量圖像生...
閱讀原文

首個中文原生DiT架構,已開源!大模型Hunyuan-DiT技術報告詳解

直播預告 | 5月23日晚7點,「智猩猩機器人新青年講座」第6講正式開講,論文一作、清華大學在讀博士郭旭東將直播講解《大模型在具身多智能體合作中的研究進展...
閱讀原文

Meta首發「變色龍」挑戰GPT-4o,34B參數引領多模態!10萬億token訓練刷新SOTA

新智元報道編輯:桃子喬楊 【新智元導讀】GPT-4o發布不到一周,首個敢于挑戰王者的新模型誕生!最近,Meta團隊發布了「混合模態」Chameleon,可以在單一神經...
閱讀原文

多模態AI是醫學的未來,谷歌推出三個新模型,Med-Gemini迎來大升級

將 ScienceAI設為星標 第一時間掌握 新鮮的 AI for Science 資訊編輯 | 白菜葉 許多臨床任務需要了解專業數據,例如醫學圖像、基因組學,這類專業知識信息在...
閱讀原文

Tunnel Try-on:阿里最新視頻試衣生成算法

直播預告 | 5月23日晚7點,「智猩猩機器人新青年講座」第6講正式開講,論文一作、清華大學在讀博士郭旭東將直播講解《大模型在具身多智能體合作中的研究進展...
閱讀原文

收集30GB、近20萬對訓練樣本,復旦大學團隊發布UniFMIR:用AI突破顯微成像極限

作者:梅菜 編輯:李寶珠,三羊 復旦大學計算機科學技術學院研究團隊,提出了跨任務、多維度圖像增強基礎 AI 模型 UniFMIR,實現了對現有熒光顯微成像極限的...
閱讀原文

首個高光譜顯著目標檢測基準數據集上線;參與創作者激勵計劃,百分百得現金大獎!

本周, OpenAI 和 Google 接連在發布會中投出核彈級產品??。OpenAI 還是一貫地愛搶新聞焦點,在 Google I/O 大會前發布了 GPT-4o。而 Google 也頻出大招,正面...
閱讀原文

StyleMamba:圖片風格不滿意?一句話就能調!

夕小瑤科技說 原創作者 | Axe_越你與哈利波特的距離,只剩一個StyleMamba! “我想,把我的圖變成朦朧馬賽克” “我想,我的畫能不能變成美美的莫奈風格” “我想...
閱讀原文

GPT-4o再秀神操作,“復現”OpenAI總裁講課,網友當真了

白交 發自 凹非寺量子位 | 公眾號 QbitAI再見了,DALL-E! OpenAI總裁兼聯合創始人Greg再次大秀GPT-4o操作,結果網友直接緬懷DALL-E。 直接看效果。 文本拼寫...
閱讀原文

谷歌反擊:Project Astra正面硬剛GPT-4o、Veo對抗Sora、新版Gemini變革搜索

機器之心報道 機器之心編輯部這就是谷歌對 OpenAI 的回應。通用的 AI,能夠真正日常用的 AI,不做成這樣現在都不好意思開發布會了。 5 月 15 日凌晨,一年一...
閱讀原文

Google 發布「AI 全家桶」反擊 GPT-4o !搜索引擎罕見大更新, 121 句「AI 」道盡焦慮

緊跟步伐 絕不落后昨晚 OpenAI 發布了 ChatGPT-4o 后,壓力就給到了 Google I/O ,仿佛 Google 無論如何也擺脫不了「AI 界的汪峰」這一稱號。 而 Google 則通...
閱讀原文

今日arXiv最熱CV大模型論文:國產開源視覺大模型InternVL 1.5發布,趕超GPT-4V水準

夕小瑤科技說 原創作者 | 墨墨2023年9月,OpenAI發布了多模態大模型GPT-4V,開啟了多模態研究熱潮。短短8個月時間內,閉源模型如Gemini系列, Qwen-VL-Max,開...
閱讀原文

一線創業者圓桌討論:多模態 AI 的創業機會在于「有用」

多模態 AI 無疑是今年大模型的發展重點之一,Sora、Midjourney、Suno 等文生視頻、文生圖、文生音樂賽道的代表產品也是用戶的關注熱點。 多模態 AI 如何落地...
閱讀原文

DiT架構大一統:一個框架集成圖像、視頻、音頻和3D生成,可編輯、能試玩

機器之心報道 編輯:杜偉、大盤雞基于 Diffusion Transformer(DiT)又迎來一大力作「Flag-DiT」,這次要將圖像、視頻、音頻和 3D「一網打盡」。今年 2 月初...
閱讀原文

Nature論文:斯坦福團隊研發出普通眼鏡尺寸的新一代AR頭盔

大數據文摘受權轉載自頭部科技 已經有太多AR設備出現,但都不算成功,斯坦福希望能改變世界。 來自斯坦福大學的科研團隊最近展示一件新產品,它是一款原型AR...
閱讀原文
1161718192048