標簽:文本

今日arXiv最熱NLP大模型論文:浙江大學:蒸一蒸,多Agent變成單一模型,效果更好

夕小瑤科技說 原創(chuàng)作者 | 謝年年“團結就是力量”,面對復雜多變的現(xiàn)實環(huán)境,multi-agent應運而生。相較于單打獨斗的single-agent,multi-agent集結了多個功能...
閱讀原文

超越OpenAI,谷歌重磅發(fā)布從大模型蒸餾的編碼器Gecko

夕小瑤科技說 原創(chuàng)作者 | Tscom 引言:介紹文本嵌入模型的重要性和挑戰(zhàn)文本嵌入模型在自然語言處理(NLP)領域扮演著至關重要的角色。它們將文本轉換為密集的...
閱讀原文

Pika聯(lián)創(chuàng)參與新研究:Diffusion能搶GPT的活了!成功挑戰(zhàn)自回歸文本范式

豐色 發(fā)自 凹非寺量子位 | 公眾號 QbitAI縱觀生成式AI領域中的兩個主導者:自回歸和擴散模型。 一個專攻文本等離散數(shù)據(jù),一個長于圖像等連續(xù)數(shù)據(jù)。 如果,我...
閱讀原文

RAG實戰(zhàn)全解析:一年探索之路

4月18-19日,由智猩猩與智東西共同主辦的2024中國生成式AI大會將在北京JW萬豪酒店舉行。大會完整議程出爐,55位嘉賓出席!免費票申請通道即將關閉,大會通票...
閱讀原文

劍指Sora!120秒超長AI視頻模型免費開玩

新智元報道編輯:alan 【新智元導讀】近日,Picsart AI Resarch等團隊聯(lián)合發(fā)布了StreamingT2V,可以生成長達1200幀、時長為2分鐘的視頻,一舉超越Sora。同時...
閱讀原文

CVPR 2024 | 僅需文本或圖像提示,新框架CustomNeRF精準編輯3D場景

機器之心專欄 機器之心編輯部美圖影像研究院(MT Lab)與中國科學院信息工程研究所、北京航空航天大學、中山大學共同提出了 3D 場景編輯方法 ——CustomNeRF,...
閱讀原文

CVPR 2024丨文本或圖像提示精準編輯 3D 場景,美圖&信工所&北航&中大聯(lián)合提出 3D 編輯方法 CustomNeRF

美圖影像研究院(MT Lab)與中國科學院信息工程研究所、北京航空航天大學、中山大學共同提出了3D場景編輯方法——CustomNeRF,同時支持文本描述和參考圖像作為3...
閱讀原文

谷歌推出Imagen 2,可生成短視頻

點擊上方藍字關注我們“谷歌發(fā)布Imagen 2,一款新的AI圖像生成工具,旨在為企業(yè)用戶提供專業(yè)服務。盡管面臨競爭和深度偽造的擔憂,谷歌通過創(chuàng)新功能和安全措施...
閱讀原文

蘋果發(fā)布多模態(tài)模型 Ferret-UI,部分手機 UI 任務超越 GPT-4V

手機廠商自研的端側模型功能,會超越純正的大模型團隊嗎?編譯 | 賴文昕 編輯 | 陳彩嫻 大模型的誕生,讓科技巨頭與創(chuàng)業(yè)公司們在新一輪的競賽中再次鳴槍出發(fā)...
閱讀原文

谷歌DeepMind發(fā)布Gecko:專攻檢索,與大7倍模型相抗衡

機器之心報道 編輯:陳萍Gecko 是一種通用的文本嵌入模型,可用于訓練包括文檔檢索、語義相似度和分類等各種任務。 文本嵌入模型在自然語言處理中扮演著重要...
閱讀原文

首個開源世界模型!百萬級上下文,長視頻理解吊打GPT-4,UC伯克利華人一作

新智元報道編輯:alan 【新智元導讀】來自UC berkeley的研究人員開源了首個世界模型,多模態(tài)性能優(yōu)秀,長視頻理解吊打GPT-4,同時將上下文長度增加到百萬級別...
閱讀原文

一眼假!GPT4V可有效識別DeepFake圖像!

夕小瑤科技說 原創(chuàng)作者 | 芒果引言:AI時代的信息真?zhèn)伪孀R在人工智能迅猛發(fā)展的今天,我們面臨著前所未有的信息真?zhèn)伪孀R挑戰(zhàn)。AI技術,尤其是深度學習模型,...
閱讀原文

上海交大新框架解鎖CLIP長文本能力,多模態(tài)生成細節(jié)拿捏,圖像檢索能力顯著提升

白交 發(fā)自 凹非寺量子位 | 公眾號 QbitAICLIP長文本能力被解鎖,圖像檢索任務表現(xiàn)顯著提升! 一些關鍵細節(jié)也能被捕捉到。上海交大聯(lián)合上海AI實驗室提出新框架...
閱讀原文

打敗 Midjourney,這個 Google 大牛推出的 AI 產品憑什么彎道超車

這可能是 最懂文字 的AI模型沒有誰能一直稱王,但加上前綴誰都有稱王的機會。 AI 文生圖,還能玩出什么新花樣? 在這片群雄割據(jù)的紅海,頭部被 Midjourney、D...
閱讀原文

馬斯克發(fā)布Grok-1.5;阿里首次開源MoE大模型;AI21 Labs首推基于Mamba的量產級模型丨AIGC大事日報

03/29 全球AIGC產業(yè)要聞 1、馬斯克發(fā)布Grok-1.5 上下文128k硬剛GPT-4 2、阿里首次開源MoE架構大模型 3、Meta下月為智能眼鏡添加AI功能 4、谷歌推出內容真實度...
閱讀原文
18910111222