標(biāo)簽：文本

一切模態(tài)，無(wú)限接近AGI！新加坡華人團(tuán)隊(duì)開(kāi)源全能「大一統(tǒng)」多模態(tài)大模型

新智元報(bào)道編輯：好困【新智元導(dǎo)讀】繼各類輸入端多模態(tài)大語(yǔ)言模型之后，新加坡國(guó)立大學(xué)華人團(tuán)隊(duì)近期開(kāi)源了一種支持任意模態(tài)輸入和任意模態(tài)輸出的「大一統(tǒng)」...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

Adobe 這個(gè) AI 作圖神器，終于全面開(kāi)放

歡迎收看最新一期的 Hunt Good 周報(bào)！在本期內(nèi)容你會(huì)看到：4 條新鮮資訊3 個(gè)有用工具3 個(gè)鮮明觀點(diǎn)1 個(gè)有趣案例Hunt for News｜先進(jìn)頭條? Meta 計(jì)劃明年初開(kāi)始...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

CIKM 2023｜TASTE：通過(guò)文本匹配緩解序列化推薦中流行偏差問(wèn)題

作者丨劉正皓1、梅森1、熊辰炎2、李曉華1、于是 3、劉知遠(yuǎn)3、谷峪1、于戈1機(jī)構(gòu)丨1. 東北大學(xué)；2. 卡內(nèi)基梅隆大學(xué)；3. 清華大學(xué)該論文發(fā)表于CIKM-2023論文鏈接...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

幾行代碼，幾秒鐘就能生成令人驚嘆的音頻樣本！HuggingFace推出音頻生成Pipeline

夕小瑤科技說(shuō) 原創(chuàng)編輯 | 謝年年音頻是我們?nèi)粘Ｉ钪胁豢苫蛉钡囊徊糠郑缃瘢珹I+音頻帶來(lái)了前所未有的體驗(yàn)。通過(guò)AI技術(shù)，只需簡(jiǎn)單地輸入一些文本提示就可...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

騰訊混元大模型發(fā)布！全自研、參數(shù)規(guī)模超千億

在今日舉行的2023騰訊全球數(shù)字生態(tài)大會(huì)上，騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生正式發(fā)布騰訊混元大模型。據(jù)悉，該大模型為騰訊全鏈路自研大...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

帶你穿越清明上河圖！DragNUWA驚艷亮相：一拖一拽讓靜圖秒變視頻

新智元報(bào)道編輯：Lumina【新智元導(dǎo)讀】微軟提出文本圖像軌跡條件視頻生成模型DragNUWA，支持手繪軌跡驅(qū)動(dòng)圖像動(dòng)態(tài)化，實(shí)現(xiàn)復(fù)雜運(yùn)動(dòng)及場(chǎng)景控制。微軟開(kāi)發(fā)的視...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

MVDream：輕松實(shí)現(xiàn)從文本到3D渲染圖像

近日，字節(jié)跳動(dòng)研究人員推出了名為MVDream的新技術(shù)，它可以僅通過(guò)文本描述生成高質(zhì)量的3D圖像。這種從文本到圖像的生成技術(shù)，被稱為“文本到3D”技術(shù)，是當(dāng)前計(jì)...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

免費(fèi)科研利器！Meta祭出Nougat，PDF格式轉(zhuǎn)換，公式表格精準(zhǔn)識(shí)別，掃描版文檔也可以

新智元報(bào)道編輯：桃子【新智元導(dǎo)讀】最新科研神器Nougat，可以把PDF中公示、文本提取出來(lái)。做研究的童鞋們簡(jiǎn)直要狂喜！近來(lái)，Meta AI研究人員推出一款OCR神器...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

國(guó)產(chǎn)語(yǔ)音對(duì)話大模型來(lái)了：李開(kāi)復(fù)零一萬(wàn)物參與，中英雙語(yǔ)多模態(tài)，開(kāi)源可商用

蕭簫發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI首個(gè)中英雙語(yǔ)的語(yǔ)音對(duì)話開(kāi)源大模型來(lái)了！這幾天，一篇關(guān)于語(yǔ)音-文本多模態(tài)大模型的論文出現(xiàn)在arXiv上，署名公司中出...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

艾倫AI推出業(yè)界最大文本數(shù)據(jù)集，包含3萬(wàn)億Tokens，超過(guò)Llama 2

迄今為止最大的開(kāi)源文本數(shù)據(jù)集。編譯 | 香草編輯 | 李水青智東西8月21日消息，艾倫AI研究所（AI2）于8月19日在其官方博客發(fā)布用于訓(xùn)練大型語(yǔ)言模型（LLM）的...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

1…20 2122