標簽:文本
一切模態,無限接近AGI!新加坡華人團隊開源全能「大一統」多模態大模型
新智元報道編輯:好困【新智元導讀】繼各類輸入端多模態大語言模型之后,新加坡國立大學華人團隊近期開源了一種支持任意模態輸入和任意模態輸出的「大一統」...
Adobe 這個 AI 作圖神器,終于全面開放
歡迎收看最新一期的 Hunt Good 周報!在本期內容你會看到:4 條新鮮資訊3 個有用工具3 個鮮明觀點1 個有趣案例Hunt for News|先進頭條?? Meta 計劃明年初開始...
CIKM 2023|TASTE:通過文本匹配緩解序列化推薦中流行偏差問題
作者丨劉正皓1、梅森1、熊辰炎2、李曉華1、于是 3、劉知遠3、谷峪1、于戈1機構丨1. 東北大學;2. 卡內基梅隆大學;3. 清華大學該論文發表于CIKM-2023論文鏈接...
幾行代碼,幾秒鐘就能生成令人驚嘆的音頻樣本!HuggingFace推出音頻生成Pipeline
夕小瑤科技說 原創編輯 | 謝年年音頻是我們日常生活中不可或缺的一部分,而如今,AI+音頻帶來了前所未有的體驗。通過AI技術,只需簡單地輸入一些文本提示就可...
騰訊混元大模型發布!全自研、參數規模超千億
在今日舉行的2023騰訊全球數字生態大會上,騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生正式發布騰訊混元大模型。據悉,該大模型為騰訊全鏈路自研大...
帶你穿越清明上河圖!DragNUWA驚艷亮相:一拖一拽讓靜圖秒變視頻
新智元報道編輯:Lumina【新智元導讀】微軟提出文本圖像軌跡條件視頻生成模型DragNUWA,支持手繪軌跡驅動圖像動態化,實現復雜運動及場景控制。微軟開發的視...
MVDream:輕松實現從文本到3D渲染圖像
近日,字節跳動研究人員推出了名為MVDream的新技術,它可以僅通過文本描述生成高質量的3D圖像。這種從文本到圖像的生成技術,被稱為“文本到3D”技術,是當前計...
免費科研利器!Meta祭出Nougat,PDF格式轉換,公式表格精準識別,掃描版文檔也可以
新智元報道編輯:桃子【新智元導讀】最新科研神器Nougat,可以把PDF中公示、文本提取出來。做研究的童鞋們簡直要狂喜!近來,Meta AI研究人員推出一款OCR神器...
國產語音對話大模型來了:李開復零一萬物參與,中英雙語多模態,開源可商用
蕭簫 發自 凹非寺量子位 | 公眾號 QbitAI首個中英雙語的語音對話開源大模型來了!這幾天,一篇關于語音-文本多模態大模型的論文出現在arXiv上,署名公司中出...
艾倫AI推出業界最大文本數據集,包含3萬億Tokens,超過Llama 2
迄今為止最大的開源文本數據集。編譯 | 香草編輯 | 李水青智東西8月21日消息,艾倫AI研究所(AI2)于8月19日在其官方博客發布用于訓練大型語言模型(LLM)的...