標簽:文本
野心勃勃的MiniGPT-5出現了!Token變Voken,支持圖文交叉生成
夕小瑤科技說 分享來源 | 機器之心大模型正在實現語言和視覺的跨越,有望無縫地理解和生成文本和圖像內容。在最近的一系列研究中,多模態特征集成不僅是一種...
全球首個支持輸入20萬字的大模型來了!一口氣讀幾十個文檔、一本20萬字的小說
作者丨李揚霞編輯丨陳彩嫻10月9日,由楊植麟創立的?之暗?,發布大模型產品——Moonshot AI,以及搭載該模型的智能助?Kimi Chat,是全球首個支持20萬字輸??...
兩行代碼解決大語言模型對話局限!港中文賈佳亞團隊聯合 MIT 發布超長文本擴展技術
代碼和Demo地址:https://github.com/dvlab-research/LongLoRA論文地址:https://arxiv.org/pdf/2309.12307.pdf中途迷失、模型偷懶、上下文越長大模型越笨......
統一圖像和文字生成的MiniGPT-5來了:Token變Voken,模型不僅能續寫,還會自動配圖了
機器之心報道機器之心編輯部OpenAI 的 GPT-5 大模型似乎還遙遙無期,但已經有研究者率先推出了創新視覺與語言交叉生成的模型 MiniGPT-5。這對于生成具有連貫...
2行代碼,「三體」一次讀完!港中文賈佳亞團隊聯手MIT發布超長文本擴展技術,打破LLM遺忘魔咒
新智元報道編輯:好困 桃子【新智元導讀】大模型上下文從此不再受限!港中文賈佳亞團隊聯手MIT發布了全新超長文本擴展技術LongLoRA,只需2行代碼,讓LLM看小...
微軟MIT出品,AI自動朗讀古騰堡6萬本電子書,還能用自己聲音定制化
新智元報道編輯:潤【新智元導讀】微軟MIT等機構用AI將古騰堡計劃的電子書轉錄為語音書,免費向公眾開放,還公開了制作流程。而且用戶還可以用自己的聲音來進...
賈佳亞團隊開源全球首個70B長文本大語言模型,讀論文看小說直接ProMax
金磊 發自 凹非寺量子位 | 公眾號 QbitAI家人們,苦長文本久矣的大語言模型(LLM),現在終于有解法了!就在最近,香港中文大學賈佳亞團隊聯合MIT宣布了一項...
別用GPT-4直出文本摘要!MIT、哥大等發布全新「密度鏈」提示:實體密度是摘要質量的關鍵
新智元報道編輯:LRS【新智元導讀】用密度鏈提示逐步改善GPT-4摘要中的實體密度,只需三步即可獲得「人類級摘要」!ChatGPT發布后,文本生成技術得到飛速發展...
文檔字越多,模型越興奮!KOSMOS-2.5:閱讀「文本密集圖像」的多模態大語言模型
新智元報道編輯:LRS 好困【新智元導讀】文字也是一種視覺信息,多模態大語言模型KOSMOS-2.5不光能讀懂論文,還能輸出markdown格式!當前一個顯著的趨勢是致...
揭秘OpenAI的震撼之舉:GPT-4V官方系統卡,你準備好被驚艷了嗎?
夕小瑤科技說 分享來源 | Web3天空之城OpenAI靜悄悄的拋出了個重磅炸彈:多模態GPT-4V(Vision)發布!GPT-4V允許用戶輸入圖像并結合文本prompt進行輸出。估...
ChatGPT「看圖說話」大變身!動嘴傳圖秒解答,幕后新模型GPT-4V亮相
新智元報道編輯:編輯部【新智元導讀】OpenAI又在深夜搞事了。ChatGPT不光能看能聽,還長嘴了。令人吃驚的是,背后的多模態模型GPT-4V(ision),竟然在2022年...
本周TOP AI論文(9月18日-9月24日)
圖|匡萃彪文|匡萃彪摘要- 驗證鏈(CoVe)減少LLMs中的幻覺- 語言建模就是壓縮- LongLoRA:高效微調長上下文大語言模型 ??- 對比解碼改善大型語言模型的推理能...
無懼圖像中的文字,TextDiffuser提供更高質量文本渲染
機器之心專欄機器之心編輯部近幾年來,Text-to-Image 領域取得了巨大的進展,特別是在 AIGC(Artificial Intelligence Generated Content)的時代。隨著 DALL...
生成式AI如何可控?谷歌DARPA等最新《識別并緩解生成式人工智能的安全風險》綜述,詳述GenAI技術安全性
來源:專知生成式人工智能(GenAI)技術,如大型語言模型(LLMs)和擴散模型,已經改變了計算領域的格局。它們啟用了一些令人興奮的應用,例如生成逼真的圖像...
OpenAI DALL·E 3來了,集成ChatGPT,生圖效果太炸了
機器之心報道機器之心編輯部集成 ChatGPT 后,DALL?E 3 對上下文的理解上了一個大臺階。終于,OpenAI 的文生圖 AI 工具 DALL-E 系列迎來了最新版本 DALL?E ...