標(biāo)簽:文本

一切模態(tài),無(wú)限接近AGI!新加坡華人團(tuán)隊(duì)開(kāi)源全能「大一統(tǒng)」多模態(tài)大模型

新智元報(bào)道編輯:好困【新智元導(dǎo)讀】繼各類輸入端多模態(tài)大語(yǔ)言模型之后,新加坡國(guó)立大學(xué)華人團(tuán)隊(duì)近期開(kāi)源了一種支持任意模態(tài)輸入和任意模態(tài)輸出的「大一統(tǒng)」...
閱讀原文

Adobe 這個(gè) AI 作圖神器,終于全面開(kāi)放

歡迎收看最新一期的 Hunt Good 周報(bào)!在本期內(nèi)容你會(huì)看到:4 條新鮮資訊3 個(gè)有用工具3 個(gè)鮮明觀點(diǎn)1 個(gè)有趣案例Hunt for News|先進(jìn)頭條? Meta 計(jì)劃明年初開(kāi)始...
閱讀原文

CIKM 2023|TASTE:通過(guò)文本匹配緩解序列化推薦中流行偏差問(wèn)題

作者丨劉正皓1、梅森1、熊辰炎2、李曉華1、于是 3、劉知遠(yuǎn)3、谷峪1、于戈1機(jī)構(gòu)丨1. 東北大學(xué);2. 卡內(nèi)基梅隆大學(xué);3. 清華大學(xué)該論文發(fā)表于CIKM-2023論文鏈接...
閱讀原文

幾行代碼,幾秒鐘就能生成令人驚嘆的音頻樣本!HuggingFace推出音頻生成Pipeline

夕小瑤科技說(shuō) 原創(chuàng)編輯 | 謝年年音頻是我們?nèi)粘I钪胁豢苫蛉钡囊徊糠郑缃瘢珹I+音頻帶來(lái)了前所未有的體驗(yàn)。通過(guò)AI技術(shù),只需簡(jiǎn)單地輸入一些文本提示就可...
閱讀原文

騰訊混元大模型發(fā)布!全自研、參數(shù)規(guī)模超千億

在今日舉行的2023騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生正式發(fā)布騰訊混元大模型。據(jù)悉,該大模型為騰訊全鏈路自研大...
閱讀原文

帶你穿越清明上河圖!DragNUWA驚艷亮相:一拖一拽讓靜圖秒變視頻

新智元報(bào)道編輯:Lumina【新智元導(dǎo)讀】微軟提出文本圖像軌跡條件視頻生成模型DragNUWA,支持手繪軌跡驅(qū)動(dòng)圖像動(dòng)態(tài)化,實(shí)現(xiàn)復(fù)雜運(yùn)動(dòng)及場(chǎng)景控制。微軟開(kāi)發(fā)的視...
閱讀原文

MVDream:輕松實(shí)現(xiàn)從文本到3D渲染圖像

近日,字節(jié)跳動(dòng)研究人員推出了名為MVDream的新技術(shù),它可以僅通過(guò)文本描述生成高質(zhì)量的3D圖像。這種從文本到圖像的生成技術(shù),被稱為“文本到3D”技術(shù),是當(dāng)前計(jì)...
閱讀原文

免費(fèi)科研利器!Meta祭出Nougat,PDF格式轉(zhuǎn)換,公式表格精準(zhǔn)識(shí)別,掃描版文檔也可以

新智元報(bào)道編輯:桃子【新智元導(dǎo)讀】最新科研神器Nougat,可以把PDF中公示、文本提取出來(lái)。做研究的童鞋們簡(jiǎn)直要狂喜!近來(lái),Meta AI研究人員推出一款OCR神器...
閱讀原文

國(guó)產(chǎn)語(yǔ)音對(duì)話大模型來(lái)了:李開(kāi)復(fù)零一萬(wàn)物參與,中英雙語(yǔ)多模態(tài),開(kāi)源可商用

蕭簫 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI首個(gè)中英雙語(yǔ)的語(yǔ)音對(duì)話開(kāi)源大模型來(lái)了!這幾天,一篇關(guān)于語(yǔ)音-文本多模態(tài)大模型的論文出現(xiàn)在arXiv上,署名公司中出...
閱讀原文

艾倫AI推出業(yè)界最大文本數(shù)據(jù)集,包含3萬(wàn)億Tokens,超過(guò)Llama 2

迄今為止最大的開(kāi)源文本數(shù)據(jù)集。編譯 | 香草編輯 | 李水青智東西8月21日消息,艾倫AI研究所(AI2)于8月19日在其官方博客發(fā)布用于訓(xùn)練大型語(yǔ)言模型(LLM)的...
閱讀原文
1202122