標(biāo)簽:圖像
GitHub 8k Star,一作實習(xí)生,字節(jié)這個大模型成果被蘋果選中了
機器之心發(fā)布 機器之心編輯部字節(jié)跳動大模型團隊成果 Depth Anything V2 現(xiàn)已被蘋果官方收入 Core ML 模型庫。本文介紹了 Depth Anything 系列成果的研發(fā)歷程...
ControlNet作者又出爆款!一張圖生成繪畫全過程,兩天狂攬1.4k Star
機器之心報道 編輯:陳陳、小舟同樣是圖生視頻,PaintsUndo 走出了不一樣的路線。ControlNet 作者 Lvmin Zhang 又開始整活了!這次瞄準(zhǔn)繪畫領(lǐng)域。 新項目 Pai...
多模態(tài)模型(VLM)部署方法拋磚引玉
7月11日19點,「智猩猩自動駕駛新青年講座」第36講將開講,主講理想汽車最新成果:基于MLLM的閉環(huán)規(guī)劃智能體PlanAgent,由理想汽車實習(xí)研究員、中國科學(xué)院自...
超過 GPT-4V!哈佛醫(yī)學(xué)院 AI 機器人登上 Nature,腫瘤識別率接近 90%
大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自學(xué)術(shù)頭條 撰文:田小婷 當(dāng)前,癌癥已經(jīng)成為全球人口死亡的主要原因之一,每年有數(shù)百萬人死于癌癥。世界衛(wèi)生組織曾提出,三分之一的癌癥...
Meta新研究挑戰(zhàn)CV領(lǐng)域基操:ViT根本不用patch,用像素做token效果更佳
新智元報道編輯:喬楊 【新智元導(dǎo)讀】下一代視覺模型會摒棄patch嗎?Meta AI最近發(fā)表的一篇論文就質(zhì)疑了視覺模型中局部關(guān)系的必要性。他們提出了PiT架構(gòu),讓T...
上交&阿里:掀開多模態(tài)大模型的頭蓋骨,解密黑盒模型推理過程
夕小瑤科技說 原創(chuàng)作者 | 謝年年多模態(tài)大模型的發(fā)展勢頭正猛,研究者們熱衷于通過微調(diào)模型,打造出具有更高輸入分辨率、更復(fù)雜功能、更強感知能力以及更精細(xì)...
更美圖像生成、直出分鐘級視頻,國產(chǎn)自研DiT架構(gòu)的越級之旅
機器之心原創(chuàng) 作者:杜偉一轉(zhuǎn)眼,2024 年已經(jīng)過半。我們不難發(fā)現(xiàn),AI 尤其是 AIGC 領(lǐng)域出現(xiàn)一個越來越明顯的趨勢:文生圖賽道進入到了穩(wěn)步推進、加速商業(yè)落地...
國產(chǎn)動漫視頻AI火了!二次元老婆隨意捏,哥特、夢幻、機甲一鍵get
新智元報道編輯:編輯部 【新智元導(dǎo)讀】視頻生成賽道又起新秀,而且還是二次元定制版!穩(wěn)定產(chǎn)出電影級畫面,一鍵文/圖生成視頻,即使是「手殘黨」也能復(fù)刻自...
「嗎嘍」在想啥?AI讀心術(shù)精準(zhǔn)重建獼猴大腦圖像,網(wǎng)友:我們成三體人了
新智元報道編輯:耳朵 Aeneas 【新智元導(dǎo)讀】荷蘭拉德布德大學(xué)的研究團隊通過定位大腦注意力機制,在AI「讀心術(shù)」領(lǐng)域精確生成圖像,能夠依據(jù)大腦活動記錄極...
AI發(fā)展方向——從pipeline到end2end
荷樓~~,大家好,我是 JioNLP。 這些天我在做圖像目標(biāo)檢測與跟蹤。 我越做越感覺,這塊 AI 任務(wù)的建模方式和處理方式存在很多的問題。 我先分開說說目標(biāo)檢測...
今天,階躍星辰正式發(fā)布萬億MoE大模型|甲子光年
國產(chǎn)大模型跑出了“階躍速度”。作者|趙健 今年的世界人工智能大會(WAIC),“大模型”含量極高,既有已發(fā)布模型的集中展示,也有大模型的首發(fā)亮相。 其中,階...
階躍星辰首發(fā)「萬億」和「多模」大模型,還與《大鬧天宮》跨界聯(lián)動 | WAIC 2024
階躍星辰 再出王炸僅僅過去 100 天左右,站在 AGI 風(fēng)口上的階躍星辰再次亮出王炸成果。 在今天揭幕的世界人工智能大會,階躍星辰宣布對 Step 系列通用大模型...
全員i人?《大鬧天宮》MBTI測試讓全公司炸鍋!最神秘國產(chǎn)大模型團隊出手了
新智元報道編輯:編輯部 【新智元導(dǎo)讀】最近,公司全體同事都在瘋狂沉迷這款《大鬧天宮MBTI》測試!各種直擊打工人的靈魂拷問,讓所有i人和e人在職場極限場景...
Llama也能做圖像生成!港大字節(jié)推出開源自回歸文生圖模型,在線體驗已開放
LlamaGen團隊 投稿量子位 | 公眾號 QbitAI只需Image Tokenizer,Llama也能做圖像生成了,而且效果超過了擴散模型。 來自港大和字節(jié)的研究人員,提出了基于自...
文字秒變立體圖像!Meta推出強大的3D生成模型
點擊上方藍字關(guān)注我們“Meta公司推出的3D Gen模型,能在60秒內(nèi)將文字轉(zhuǎn)化為立體圖像,預(yù)示著創(chuàng)意產(chǎn)業(yè)的一次重大突破。Meta公司在人工智能領(lǐng)域取得了突破性進展...