標簽:圖像
GitHub 8k Star,一作實習生,字節這個大模型成果被蘋果選中了
機器之心發布 機器之心編輯部字節跳動大模型團隊成果 Depth Anything V2 現已被蘋果官方收入 Core ML 模型庫。本文介紹了 Depth Anything 系列成果的研發歷程...
ControlNet作者又出爆款!一張圖生成繪畫全過程,兩天狂攬1.4k Star
機器之心報道 編輯:陳陳、小舟同樣是圖生視頻,PaintsUndo 走出了不一樣的路線。ControlNet 作者 Lvmin Zhang 又開始整活了!這次瞄準繪畫領域。 新項目 Pai...
多模態模型(VLM)部署方法拋磚引玉
7月11日19點,「智猩猩自動駕駛新青年講座」第36講將開講,主講理想汽車最新成果:基于MLLM的閉環規劃智能體PlanAgent,由理想汽車實習研究員、中國科學院自...
超過 GPT-4V!哈佛醫學院 AI 機器人登上 Nature,腫瘤識別率接近 90%
大數據文摘受權轉載自學術頭條 撰文:田小婷 當前,癌癥已經成為全球人口死亡的主要原因之一,每年有數百萬人死于癌癥。世界衛生組織曾提出,三分之一的癌癥...
Meta新研究挑戰CV領域基操:ViT根本不用patch,用像素做token效果更佳
新智元報道編輯:喬楊 【新智元導讀】下一代視覺模型會摒棄patch嗎?Meta AI最近發表的一篇論文就質疑了視覺模型中局部關系的必要性。他們提出了PiT架構,讓T...
上交&阿里:掀開多模態大模型的頭蓋骨,解密黑盒模型推理過程
夕小瑤科技說 原創作者 | 謝年年多模態大模型的發展勢頭正猛,研究者們熱衷于通過微調模型,打造出具有更高輸入分辨率、更復雜功能、更強感知能力以及更精細...
更美圖像生成、直出分鐘級視頻,國產自研DiT架構的越級之旅
機器之心原創 作者:杜偉一轉眼,2024 年已經過半。我們不難發現,AI 尤其是 AIGC 領域出現一個越來越明顯的趨勢:文生圖賽道進入到了穩步推進、加速商業落地...
國產動漫視頻AI火了!二次元老婆隨意捏,哥特、夢幻、機甲一鍵get
新智元報道編輯:編輯部 【新智元導讀】視頻生成賽道又起新秀,而且還是二次元定制版!穩定產出電影級畫面,一鍵文/圖生成視頻,即使是「手殘黨」也能復刻自...
「嗎嘍」在想啥?AI讀心術精準重建獼猴大腦圖像,網友:我們成三體人了
新智元報道編輯:耳朵 Aeneas 【新智元導讀】荷蘭拉德布德大學的研究團隊通過定位大腦注意力機制,在AI「讀心術」領域精確生成圖像,能夠依據大腦活動記錄極...
AI發展方向——從pipeline到end2end
荷樓~~,大家好,我是 JioNLP。 這些天我在做圖像目標檢測與跟蹤。 我越做越感覺,這塊 AI 任務的建模方式和處理方式存在很多的問題。 我先分開說說目標檢測...
今天,階躍星辰正式發布萬億MoE大模型|甲子光年
國產大模型跑出了“階躍速度”。作者|趙健 今年的世界人工智能大會(WAIC),“大模型”含量極高,既有已發布模型的集中展示,也有大模型的首發亮相。 其中,階...
階躍星辰首發「萬億」和「多模」大模型,還與《大鬧天宮》跨界聯動 | WAIC 2024
階躍星辰 再出王炸僅僅過去 100 天左右,站在 AGI 風口上的階躍星辰再次亮出王炸成果。 在今天揭幕的世界人工智能大會,階躍星辰宣布對 Step 系列通用大模型...
全員i人?《大鬧天宮》MBTI測試讓全公司炸鍋!最神秘國產大模型團隊出手了
新智元報道編輯:編輯部 【新智元導讀】最近,公司全體同事都在瘋狂沉迷這款《大鬧天宮MBTI》測試!各種直擊打工人的靈魂拷問,讓所有i人和e人在職場極限場景...
Llama也能做圖像生成!港大字節推出開源自回歸文生圖模型,在線體驗已開放
LlamaGen團隊 投稿量子位 | 公眾號 QbitAI只需Image Tokenizer,Llama也能做圖像生成了,而且效果超過了擴散模型。 來自港大和字節的研究人員,提出了基于自...
文字秒變立體圖像!Meta推出強大的3D生成模型
點擊上方藍字關注我們“Meta公司推出的3D Gen模型,能在60秒內將文字轉化為立體圖像,預示著創意產業的一次重大突破。Meta公司在人工智能領域取得了突破性進展...