標簽:文本

視覺語言模型導論:這篇論文能成為你進軍VLM的第一步

機器之心報道 編輯:Panda近些年,語言建模領域進展非凡。Llama 或 ChatGPT 等許多大型語言模型(LLM)有能力解決多種不同的任務,它們也正在成為越來越常用...
閱讀原文

萬字測評!開發(fā)者視角看智譜GLM-4-9B

智譜于 2024年6月5日發(fā)布了其新一代開源模型——GLM-4-9B,以 9B 的體量,同時支持了 128K 長上下文推理、26種語言多語言支持,且在多個經(jīng)典評測任務上都實現(xiàn)了...
閱讀原文

ICML 2024 Oral|外部引導的深度聚類新范式

AIxiv專欄是機器之心發(fā)布學術、技術內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學術...
閱讀原文

CLIP當RNN用入選CVPR:無需訓練即可分割無數(shù)概念|牛津大學&谷歌研究院

K君 投稿量子位 | 公眾號 QbitAI循環(huán)調(diào)用CLIP,無需額外訓練就有效分割無數(shù)概念。 包括電影動漫人物,地標,品牌,和普通類別在內(nèi)的任意短語。 牛津大學與谷...
閱讀原文

多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構Zipper:分開訓練再「壓縮」

機器之心報道 編輯:蛋醬最近的一系列研究表明,純解碼器生成模型可以通過訓練利用下一個 token 預測生成有用的表征,從而成功地生成多種模態(tài)(如音頻、圖像...
閱讀原文

爆火ChatTTS突破開源語音天花板,3天斬獲9k的Star量

機器之心報道 編輯:陳萍、佳琪未來人與人的交流,難道是這個樣?近日,一個名為 ChatTTS 文本轉(zhuǎn)語音項目爆火出圈,引來大家極大的關注。短短三天時間,在 Gi...
閱讀原文

OCR小模型仍有機會!華科等提出VIMTS:零樣本視頻端到端識別新SOTA

新智元報道編輯:LRT 【新智元導讀】通過提示查詢生成模塊和任務感知適配器,大一統(tǒng)框架VimTS在不同任務間實現(xiàn)更好的協(xié)同作用,顯著提升了模型的泛化能力。該...
閱讀原文

不影響輸出質(zhì)量還能追蹤溯源,「大模型無偏水印」入選ICLR 2024 Spotlight

AIxiv專欄是機器之心發(fā)布學術、技術內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學術...
閱讀原文

任意模態(tài)輸入輸出?語音/文本/圖像/音樂都拿下! 復旦提出AnyGPT:序列建模的統(tǒng)一多模態(tài) LLM

直播預告 | 5月28日10點,「智猩猩AI新青年講座」第236講正式開講,密歇根大學安娜堡分校在讀博士生張揮杰將直播講解《利用多級框架和多解碼器架構提高擴散模...
閱讀原文

GPT模型的前世今生

大數(shù)據(jù)文摘授權轉(zhuǎn)載自數(shù)據(jù)派THU 作者:李媛媛 1 GPT模型概述 GPT模型,全稱Generative Pre-trained Transformer,由OpenAI團隊開發(fā),是一種基于深度學習的自...
閱讀原文

Meta發(fā)布多模態(tài)模型Chameleon:34B、類GPT-4o、性能接近GPT-4V

GPT-4o 的橫空出世,再次創(chuàng)立了一個多模態(tài)模型發(fā)展的新范式。OpenAI 將其稱為「首個『原生』多模態(tài)」模型,意味著 GPT-4o 與以往所有的模型,都不盡相同。傳...
閱讀原文

另辟蹊徑挑戰(zhàn)GPT-4o!Meta首發(fā)混合模態(tài)大模型Chameleon

直播預告 | 5月23日晚7點,「智猩猩機器人新青年講座」第6講正式開講,論文一作、清華大學在讀博士郭旭東將直播講解《大模型在具身多智能體合作中的研究進展...
閱讀原文

首個中文原生DiT架構,已開源!大模型Hunyuan-DiT技術報告詳解

直播預告 | 5月23日晚7點,「智猩猩機器人新青年講座」第6講正式開講,論文一作、清華大學在讀博士郭旭東將直播講解《大模型在具身多智能體合作中的研究進展...
閱讀原文

Meta首發(fā)「變色龍」挑戰(zhàn)GPT-4o,34B參數(shù)引領多模態(tài)!10萬億token訓練刷新SOTA

新智元報道編輯:桃子喬楊 【新智元導讀】GPT-4o發(fā)布不到一周,首個敢于挑戰(zhàn)王者的新模型誕生!最近,Meta團隊發(fā)布了「混合模態(tài)」Chameleon,可以在單一神經(jīng)...
閱讀原文

StyleMamba:圖片風格不滿意?一句話就能調(diào)!

夕小瑤科技說 原創(chuàng)作者 | Axe_越你與哈利波特的距離,只剩一個StyleMamba! “我想,把我的圖變成朦朧馬賽克” “我想,我的畫能不能變成美美的莫奈風格” “我想...
閱讀原文
167891022