標簽:圖像
Sora 團隊負責人 Aditya Ramesh 對話謝賽寧丨壓縮一切!視覺與語言模態的融合?
大數據文摘受權轉載自智源社區 2024 年 6 月 14 日,一年一度的智源大會又迎來重磅嘉賓。 當紅視頻生成大模型「Sora」團隊的負責人Aditya Ramesh在2024智源大...
2024 Meet AI Compiler 北京線下聚會定檔!千萬級指令微調數據集 InfinityInstruct 開源
高質量的指令數據是訓練和優化大語言模型不可或缺的資源,是提升模型性能的基石。近日,北京智源人工智能研究院發布了千萬級高質量指令微調數據集開源項目 In...
大腦是如何工作的?谷歌和哈佛的研究人員用AI把它畫出來了|NIO Capital 未來生活
Google Research & Lichtman Lab/Harvard University ??不久前,谷歌和哈佛大學的研究人員發布了一組人類大腦及其神經網絡的詳細圖像,這個圖像被稱為迄...
AI畫連環畫角色更一致了!人物之間的復雜互動也能處理|中山大學&聯想團隊出品
AutoStudio團隊 投稿量子位 | 公眾號 QbitAI讓AI畫漫畫角色保持一致的新研究來了! 創作的連環畫效果belike: 頻繁切換主體、人物之間復雜的互動也能保持角色...
InstaFlow一作劉星超:利用直線概率流加速Stable Diffusion的訓練推理 | 講座預告
「智猩猩AI新青年講座」由智猩猩出品,致力于邀請青年學者,主講他們在生成式AI、LLM、AI Agent、CV等人工智能領域的最新重要研究成果。 AI新青年是加速人工...
最近值得關注的 AI 產品:比肩 Sora 的 Luma、SD3 開源、MJ 新功能
AI一天,人間一年,短短一晚上,三大重量級廠商都迎來了史詩級的更新:而且每個產品效果都非常炸裂,對于AI領域從業者可謂是又一個春節; 1、Luma 發布了類似...
一步文生圖大模型還能“更小更快”,MixDQ量化方法無損“瘦身”擴散模型3倍,提速1.5倍
大數據文摘授權轉載自將門創投 作者:趙天辰 我們提出了MixDQ,一種面向少步擴散模型的混合比特量化方案。 MixDQ分析定位了“少步擴散模型量化”的獨特問題,并...
喜發新模型,卻被眾嘲是破產“前兆”!Stability AI “最強”模型人形繪制太“陰間”,網友:因為研發太講武德
整理 | 華衛、核子可樂 6 月 12 日,Stability AI 推出了 Stable Diffusion 3 Medium,這家英國初創公司稱其為“迄今為止最先進的文本到圖像開放模型”。至關...
剛剛!Stable Diffusion 3 重磅開源,超全圖像生成必備訓練數據集、教程匯總
Stability AI 已經正式開源 Stable Diffusion 3(簡稱 SD3)!SD3 是一個圖像生成模型,只要給定一段描述性的文字,就能夠創造出與之匹配的視覺作品。下圖就...
復旦字節強強聯手,量身定制多模態思維鏈,讓7B模型全面超越GPT-4V
夕小瑤科技說 原創作者 | 任同學多模態大模型在不同的任務中表現出了令人印象深刻的能力,但是在處理復雜任務時,模型的性能仍然受到了單步推理范式的限制。...
候選CVPR 2024最佳論文!深圳大手香港理工發布MemSAM:將 「分割一切」模型用于醫學視頻分割
作者:梅菜 編輯:李寶珠,三羊 深圳大學計算機與軟件學院和香港理工大學智能健康研究中心聯合提出了一種新穎的超聲心動圖視頻分割模型 MemSAM,與現有模型相...
蘋果AI一夜顛覆所有!Siri史詩級進化,內掛ChatGPT-4o,奧特曼來了,馬斯克怒了
剛剛,蘋果智能誕生!AI顛覆所有App和OS體驗。 作者|智東西編輯部 剛剛,蘋果AI,正式交卷! 智東西美國加州庫比提諾蘋果總部WWDC24現場報道,今天,蘋果構建...
蘋果智能炸裂登場:直接GPT-4o加持,全家桶都上生成式AI,Siri脫胎換骨
機器之心報道 機器之心編輯部還有史詩級更新:iPhone 加通話錄音,iPad 加計算器。不止 Siri 或 iPhone,整個蘋果,向前邁進了一大步。 北京時間 6 月 11 日...
視覺語言模型導論:這篇論文能成為你進軍VLM的第一步
機器之心報道 編輯:Panda近些年,語言建模領域進展非凡。Llama 或 ChatGPT 等許多大型語言模型(LLM)有能力解決多種不同的任務,它們也正在成為越來越常用...
CVPR 2024|讓圖像擴散模型生成高質量360度場景,只需要一個語言模型
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...