標簽:文本
今日arXiv最熱NLP大模型論文:浙江大學:蒸一蒸,多Agent變成單一模型,效果更好
夕小瑤科技說 原創(chuàng)作者 | 謝年年“團結就是力量”,面對復雜多變的現(xiàn)實環(huán)境,multi-agent應運而生。相較于單打獨斗的single-agent,multi-agent集結了多個功能...
超越OpenAI,谷歌重磅發(fā)布從大模型蒸餾的編碼器Gecko
夕小瑤科技說 原創(chuàng)作者 | Tscom 引言:介紹文本嵌入模型的重要性和挑戰(zhàn)文本嵌入模型在自然語言處理(NLP)領域扮演著至關重要的角色。它們將文本轉換為密集的...
Pika聯(lián)創(chuàng)參與新研究:Diffusion能搶GPT的活了!成功挑戰(zhàn)自回歸文本范式
豐色 發(fā)自 凹非寺量子位 | 公眾號 QbitAI縱觀生成式AI領域中的兩個主導者:自回歸和擴散模型。 一個專攻文本等離散數(shù)據(jù),一個長于圖像等連續(xù)數(shù)據(jù)。 如果,我...
RAG實戰(zhàn)全解析:一年探索之路
4月18-19日,由智猩猩與智東西共同主辦的2024中國生成式AI大會將在北京JW萬豪酒店舉行。大會完整議程出爐,55位嘉賓出席!免費票申請通道即將關閉,大會通票...
劍指Sora!120秒超長AI視頻模型免費開玩
新智元報道編輯:alan 【新智元導讀】近日,Picsart AI Resarch等團隊聯(lián)合發(fā)布了StreamingT2V,可以生成長達1200幀、時長為2分鐘的視頻,一舉超越Sora。同時...
CVPR 2024 | 僅需文本或圖像提示,新框架CustomNeRF精準編輯3D場景
機器之心專欄 機器之心編輯部美圖影像研究院(MT Lab)與中國科學院信息工程研究所、北京航空航天大學、中山大學共同提出了 3D 場景編輯方法 ——CustomNeRF,...
CVPR 2024丨文本或圖像提示精準編輯 3D 場景,美圖&信工所&北航&中大聯(lián)合提出 3D 編輯方法 CustomNeRF
美圖影像研究院(MT Lab)與中國科學院信息工程研究所、北京航空航天大學、中山大學共同提出了3D場景編輯方法——CustomNeRF,同時支持文本描述和參考圖像作為3...
谷歌推出Imagen 2,可生成短視頻
點擊上方藍字關注我們“谷歌發(fā)布Imagen 2,一款新的AI圖像生成工具,旨在為企業(yè)用戶提供專業(yè)服務。盡管面臨競爭和深度偽造的擔憂,谷歌通過創(chuàng)新功能和安全措施...
蘋果發(fā)布多模態(tài)模型 Ferret-UI,部分手機 UI 任務超越 GPT-4V
手機廠商自研的端側模型功能,會超越純正的大模型團隊嗎?編譯 | 賴文昕 編輯 | 陳彩嫻 大模型的誕生,讓科技巨頭與創(chuàng)業(yè)公司們在新一輪的競賽中再次鳴槍出發(fā)...
谷歌DeepMind發(fā)布Gecko:專攻檢索,與大7倍模型相抗衡
機器之心報道 編輯:陳萍Gecko 是一種通用的文本嵌入模型,可用于訓練包括文檔檢索、語義相似度和分類等各種任務。 文本嵌入模型在自然語言處理中扮演著重要...
首個開源世界模型!百萬級上下文,長視頻理解吊打GPT-4,UC伯克利華人一作
新智元報道編輯:alan 【新智元導讀】來自UC berkeley的研究人員開源了首個世界模型,多模態(tài)性能優(yōu)秀,長視頻理解吊打GPT-4,同時將上下文長度增加到百萬級別...
一眼假!GPT4V可有效識別DeepFake圖像!
夕小瑤科技說 原創(chuàng)作者 | 芒果引言:AI時代的信息真?zhèn)伪孀R在人工智能迅猛發(fā)展的今天,我們面臨著前所未有的信息真?zhèn)伪孀R挑戰(zhàn)。AI技術,尤其是深度學習模型,...
上海交大新框架解鎖CLIP長文本能力,多模態(tài)生成細節(jié)拿捏,圖像檢索能力顯著提升
白交 發(fā)自 凹非寺量子位 | 公眾號 QbitAICLIP長文本能力被解鎖,圖像檢索任務表現(xiàn)顯著提升! 一些關鍵細節(jié)也能被捕捉到。上海交大聯(lián)合上海AI實驗室提出新框架...
打敗 Midjourney,這個 Google 大牛推出的 AI 產品憑什么彎道超車
這可能是 最懂文字 的AI模型沒有誰能一直稱王,但加上前綴誰都有稱王的機會。 AI 文生圖,還能玩出什么新花樣? 在這片群雄割據(jù)的紅海,頭部被 Midjourney、D...
馬斯克發(fā)布Grok-1.5;阿里首次開源MoE大模型;AI21 Labs首推基于Mamba的量產級模型丨AIGC大事日報
03/29 全球AIGC產業(yè)要聞 1、馬斯克發(fā)布Grok-1.5 上下文128k硬剛GPT-4 2、阿里首次開源MoE架構大模型 3、Meta下月為智能眼鏡添加AI功能 4、谷歌推出內容真實度...