標簽：圖像

GitHub 8k Star，一作實習生，字節這個大模型成果被蘋果選中了

機器之心發布機器之心編輯部字節跳動大模型團隊成果 Depth Anything V2 現已被蘋果官方收入 Core ML 模型庫。本文介紹了 Depth Anything 系列成果的研發歷程...

閱讀原文

AIGC動態

1年前 (2024)

ControlNet作者又出爆款！一張圖生成繪畫全過程，兩天狂攬1.4k Star

機器之心報道編輯：陳陳、小舟同樣是圖生視頻，PaintsUndo 走出了不一樣的路線。ControlNet 作者 Lvmin Zhang 又開始整活了！這次瞄準繪畫領域。新項目 Pai...

閱讀原文

AIGC動態

1年前 (2024)

多模態模型(VLM)部署方法拋磚引玉

7月11日19點，「智猩猩自動駕駛新青年講座」第36講將開講，主講理想汽車最新成果：基于MLLM的閉環規劃智能體PlanAgent，由理想汽車實習研究員、中國科學院自...

閱讀原文

AIGC動態

1年前 (2024)

超過 GPT-4V！哈佛醫學院 AI 機器人登上 Nature，腫瘤識別率接近 90%

大數據文摘受權轉載自學術頭條撰文：田小婷當前，癌癥已經成為全球人口死亡的主要原因之一，每年有數百萬人死于癌癥。世界衛生組織曾提出，三分之一的癌癥...

閱讀原文

AIGC動態

1年前 (2024)

Meta新研究挑戰CV領域基操：ViT根本不用patch，用像素做token效果更佳

新智元報道編輯：喬楊【新智元導讀】下一代視覺模型會摒棄patch嗎？Meta AI最近發表的一篇論文就質疑了視覺模型中局部關系的必要性。他們提出了PiT架構，讓T...

閱讀原文

AIGC動態

1年前 (2024)

上交&阿里：掀開多模態大模型的頭蓋骨，解密黑盒模型推理過程

夕小瑤科技說原創作者 | 謝年年多模態大模型的發展勢頭正猛，研究者們熱衷于通過微調模型，打造出具有更高輸入分辨率、更復雜功能、更強感知能力以及更精細...

閱讀原文

AIGC動態

1年前 (2024)

更美圖像生成、直出分鐘級視頻，國產自研DiT架構的越級之旅

機器之心原創作者：杜偉一轉眼，2024 年已經過半。我們不難發現，AI 尤其是 AIGC 領域出現一個越來越明顯的趨勢：文生圖賽道進入到了穩步推進、加速商業落地...

閱讀原文

AIGC動態

1年前 (2024)

國產動漫視頻AI火了！二次元老婆隨意捏，哥特、夢幻、機甲一鍵get

新智元報道編輯：編輯部【新智元導讀】視頻生成賽道又起新秀，而且還是二次元定制版！穩定產出電影級畫面，一鍵文/圖生成視頻，即使是「手殘黨」也能復刻自...

閱讀原文

AIGC動態

1年前 (2024)

「嗎嘍」在想啥？AI讀心術精準重建獼猴大腦圖像，網友：我們成三體人了

新智元報道編輯：耳朵 Aeneas 【新智元導讀】荷蘭拉德布德大學的研究團隊通過定位大腦注意力機制，在AI「讀心術」領域精確生成圖像，能夠依據大腦活動記錄極...

閱讀原文

AIGC動態

1年前 (2024)

AI發展方向——從pipeline到end2end

荷樓~~，大家好，我是 JioNLP。這些天我在做圖像目標檢測與跟蹤。我越做越感覺，這塊 AI 任務的建模方式和處理方式存在很多的問題。我先分開說說目標檢測...

閱讀原文

AIGC動態

1年前 (2024)

今天，階躍星辰正式發布萬億MoE大模型｜甲子光年

國產大模型跑出了“階躍速度”。作者｜趙健今年的世界人工智能大會（WAIC），“大模型”含量極高，既有已發布模型的集中展示，也有大模型的首發亮相。其中，階...

閱讀原文

AIGC動態

1年前 (2024)

階躍星辰首發「萬億」和「多模」大模型，還與《大鬧天宮》跨界聯動 | WAIC 2024

階躍星辰再出王炸僅僅過去 100 天左右，站在 AGI 風口上的階躍星辰再次亮出王炸成果。在今天揭幕的世界人工智能大會，階躍星辰宣布對 Step 系列通用大模型...

閱讀原文

AIGC動態

1年前 (2024)

全員i人？《大鬧天宮》MBTI測試讓全公司炸鍋！最神秘國產大模型團隊出手了

新智元報道編輯：編輯部【新智元導讀】最近，公司全體同事都在瘋狂沉迷這款《大鬧天宮MBTI》測試！各種直擊打工人的靈魂拷問，讓所有i人和e人在職場極限場景...

閱讀原文

AIGC動態

1年前 (2024)

Llama也能做圖像生成！港大字節推出開源自回歸文生圖模型，在線體驗已開放

LlamaGen團隊投稿量子位 | 公眾號 QbitAI只需Image Tokenizer，Llama也能做圖像生成了，而且效果超過了擴散模型。來自港大和字節的研究人員，提出了基于自...

閱讀原文

AIGC動態

1年前 (2024)

文字秒變立體圖像！Meta推出強大的3D生成模型

點擊上方藍字關注我們“Meta公司推出的3D Gen模型，能在60秒內將文字轉化為立體圖像，預示著創意產業的一次重大突破。Meta公司在人工智能領域取得了突破性進展...

閱讀原文

AIGC動態

1年前 (2024)

1…10 111213 14…48