標簽:文本

語言圖像模型大一統!Meta將Transformer和Diffusion融合,多模態AI王者登場

來源:新智元編輯:Aeneas 好困 【導讀】就在剛剛,Meta最新發布的Transfusion,能夠訓練生成文本和圖像的統一模型了!完美融合Transformer和擴散領域之后,...
閱讀原文

統一transformer與diffusion!Meta融合新方法劍指下一代多模態王者

機器之心報道 編輯:陳陳本文引入了 Transfusion,這是一種可以在離散和連續數據上訓練多模態模型的方法。一般來說,多模態生成模型需要能夠感知、處理和生成...
閱讀原文

ECCV 2024 | 機器遺忘之后,擴散模型真正安全了嗎?

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

一句話生成《黑神話:悟空》3D資產,胡淵鳴創業項目Meshy上新,免費試用

機器之心報道 編輯:佳琪、張倩幾何更干凈、細致,工作流更合理,Meshy的3D生成能力又進化了,所有人都可以免費試用。天命人,你現在已經到哪兒了? 毫無疑問...
閱讀原文

Midjourney官宣網頁版免費用!前谷歌大佬祭出AI生圖2.0,全網驚艷實測

新智元報道編輯:編輯部 【新智元導讀】Midjourney一度穩居AI生圖的第一梯隊,甚至是很多人心中的Top1。但是Ideogram 2.0的發布,搶奪了Midjourney的榮光,不...
閱讀原文

難倒了Midjourney和FLux的問題,被它解了!AI生圖的終結者殺出來了

夕小瑤科技說 原創作者 | 海野Ideogram,一個一年前發布的AI生圖模型,在生成圖片領域一直不溫不火,甚至大有要被遺忘的趨勢。 但就在昨晚,Ideogram重磅推出...
閱讀原文

Ideogram 發布 2.0,效果優于 Midjourney 和 DALL-E

點擊上方藍字關注我們Idogram AI 于周三推出了其文本到圖像模型的下一代——Idogram 2.0,目標是挑戰在生成性 AI 領域中已經確立地位的公司。 這一發布緊隨 Flu...
閱讀原文

LLM大模型:預訓練、微調與產品化落地的科普之旅

大數據文摘受權轉載自數據派THU 作者:李媛媛 編輯:王菁在人工智能的浩瀚星空中,大型語言模型(Large Language Model,簡稱LLM)無疑是一顆璀璨的明星。這...
閱讀原文

Nature:AI讓抄襲問題更加復雜,科學家該如何應對?

新智元報道編輯:庸庸 喬楊 【新智元導讀】生成式人工智能在寫作中的爆炸性應用讓抄襲變得難以界定,引發了學術圈的一場大討論。從哈佛大學校長因抄襲指控在1...
閱讀原文

多篇3D生成頂會成果!斯坦福大學吳佳俊教授團隊提出交互式3D世界生成 | 講座預告

「智猩猩AI新青年講座」由智猩猩出品,致力于邀請青年學者,主講他們在生成式AI、LLM、AI Agent、CV等人工智能領域的最新重要研究成果。 AI新青年是加速人工...
閱讀原文

別等GPT-4o啦,國產「開源版」GPT-4o 來了!支持全模態、無障礙交流

夕小瑤科技說 原創作者 | 謝年年騰訊最近的多模態進展有點子“一路高歌”,先是騰訊元寶升級了一波多模態能力,就差把GPT-4o從榜一拉下來了。 最近,又搞了一個...
閱讀原文

浙江大學發布全能多模態大模型OmniBind,刷榜13大benchmark

夕小瑤科技說 原創作者 | Richard在人工智能快速發展的今天,多模態大模型成為了研究的熱點。近日,浙江大學的研究團隊在這一領域取得了重大突破,發布了名為...
閱讀原文

入選ACL 2024!實現蛋白質數據與文本信息跨模態解讀,中科大王翔團隊提出蛋白質-文本生成框架ProtT3

作者:十九 編輯:李寶珠 中國科學技術大學王翔,聯合新加坡國立大學劉致遠團隊、北海道大學研究團隊提出了一個全新的蛋白質-文本建模框架 ProtT3,該框架通...
閱讀原文

清華唐杰團隊新作:一口氣生成2萬字,大模型開卷長輸出

明敏 發自 凹非寺量子位 | 公眾號 QbitAI一口氣生成2萬字,大模型輸出也卷起來了! 清華&智譜AI最新研究,成功讓GLM-4、Llama-3.1輸出長度都暴增。 相同...
閱讀原文

月之暗面對談 Zilliz:長文本和 RAG 如何選擇?

關于長文本和 RAG 到底如何選擇,一直有爭論,從基模公司到應用開發者。 今天這篇文章,是來自基模公司月之暗面和中間層 Zilliz 的技術對話,值得一看。 本期...
閱讀原文
12345622