標(biāo)簽:文本

野心勃勃的MiniGPT-5出現(xiàn)了!Token變Voken,支持圖文交叉生成

夕小瑤科技說(shuō) 分享來(lái)源 | 機(jī)器之心大模型正在實(shí)現(xiàn)語(yǔ)言和視覺(jué)的跨越,有望無(wú)縫地理解和生成文本和圖像內(nèi)容。在最近的一系列研究中,多模態(tài)特征集成不僅是一種...
閱讀原文

全球首個(gè)支持輸入20萬(wàn)字的大模型來(lái)了!一口氣讀幾十個(gè)文檔、一本20萬(wàn)字的小說(shuō)

作者丨李揚(yáng)霞編輯丨陳彩嫻10月9日,由楊植麟創(chuàng)立的?之暗?,發(fā)布大模型產(chǎn)品——Moonshot AI,以及搭載該模型的智能助?Kimi Chat,是全球首個(gè)支持20萬(wàn)字輸??...
閱讀原文

兩行代碼解決大語(yǔ)言模型對(duì)話局限!港中文賈佳亞團(tuán)隊(duì)聯(lián)合 MIT 發(fā)布超長(zhǎng)文本擴(kuò)展技術(shù)

代碼和Demo地址:https://github.com/dvlab-research/LongLoRA論文地址:https://arxiv.org/pdf/2309.12307.pdf中途迷失、模型偷懶、上下文越長(zhǎng)大模型越笨......
閱讀原文

統(tǒng)一圖像和文字生成的MiniGPT-5來(lái)了:Token變Voken,模型不僅能續(xù)寫(xiě),還會(huì)自動(dòng)配圖了

機(jī)器之心報(bào)道機(jī)器之心編輯部OpenAI 的 GPT-5 大模型似乎還遙遙無(wú)期,但已經(jīng)有研究者率先推出了創(chuàng)新視覺(jué)與語(yǔ)言交叉生成的模型 MiniGPT-5。這對(duì)于生成具有連貫...
閱讀原文

2行代碼,「三體」一次讀完!港中文賈佳亞團(tuán)隊(duì)聯(lián)手MIT發(fā)布超長(zhǎng)文本擴(kuò)展技術(shù),打破LLM遺忘魔咒

新智元報(bào)道編輯:好困 桃子【新智元導(dǎo)讀】大模型上下文從此不再受限!港中文賈佳亞團(tuán)隊(duì)聯(lián)手MIT發(fā)布了全新超長(zhǎng)文本擴(kuò)展技術(shù)LongLoRA,只需2行代碼,讓LLM看小...
閱讀原文

微軟MIT出品,AI自動(dòng)朗讀古騰堡6萬(wàn)本電子書(shū),還能用自己聲音定制化

新智元報(bào)道編輯:潤(rùn)【新智元導(dǎo)讀】微軟MIT等機(jī)構(gòu)用AI將古騰堡計(jì)劃的電子書(shū)轉(zhuǎn)錄為語(yǔ)音書(shū),免費(fèi)向公眾開(kāi)放,還公開(kāi)了制作流程。而且用戶(hù)還可以用自己的聲音來(lái)進(jìn)...
閱讀原文

賈佳亞團(tuán)隊(duì)開(kāi)源全球首個(gè)70B長(zhǎng)文本大語(yǔ)言模型,讀論文看小說(shuō)直接ProMax

金磊 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI家人們,苦長(zhǎng)文本久矣的大語(yǔ)言模型(LLM),現(xiàn)在終于有解法了!就在最近,香港中文大學(xué)賈佳亞團(tuán)隊(duì)聯(lián)合MIT宣布了一項(xiàng)...
閱讀原文

別用GPT-4直出文本摘要!MIT、哥大等發(fā)布全新「密度鏈」提示:實(shí)體密度是摘要質(zhì)量的關(guān)鍵

新智元報(bào)道編輯:LRS【新智元導(dǎo)讀】用密度鏈提示逐步改善GPT-4摘要中的實(shí)體密度,只需三步即可獲得「人類(lèi)級(jí)摘要」!ChatGPT發(fā)布后,文本生成技術(shù)得到飛速發(fā)展...
閱讀原文

文檔字越多,模型越興奮!KOSMOS-2.5:閱讀「文本密集圖像」的多模態(tài)大語(yǔ)言模型

新智元報(bào)道編輯:LRS 好困【新智元導(dǎo)讀】文字也是一種視覺(jué)信息,多模態(tài)大語(yǔ)言模型KOSMOS-2.5不光能讀懂論文,還能輸出markdown格式!當(dāng)前一個(gè)顯著的趨勢(shì)是致...
閱讀原文

揭秘OpenAI的震撼之舉:GPT-4V官方系統(tǒng)卡,你準(zhǔn)備好被驚艷了嗎?

夕小瑤科技說(shuō) 分享來(lái)源 | Web3天空之城OpenAI靜悄悄的拋出了個(gè)重磅炸彈:多模態(tài)GPT-4V(Vision)發(fā)布!GPT-4V允許用戶(hù)輸入圖像并結(jié)合文本prompt進(jìn)行輸出。估...
閱讀原文

ChatGPT「看圖說(shuō)話」大變身!動(dòng)嘴傳圖秒解答,幕后新模型GPT-4V亮相

新智元報(bào)道編輯:編輯部【新智元導(dǎo)讀】OpenAI又在深夜搞事了。ChatGPT不光能看能聽(tīng),還長(zhǎng)嘴了。令人吃驚的是,背后的多模態(tài)模型GPT-4V(ision),竟然在2022年...
閱讀原文

本周TOP AI論文(9月18日-9月24日)

圖|匡萃彪文|匡萃彪摘要- 驗(yàn)證鏈(CoVe)減少LLMs中的幻覺(jué)- 語(yǔ)言建模就是壓縮- LongLoRA:高效微調(diào)長(zhǎng)上下文大語(yǔ)言模型 ??- 對(duì)比解碼改善大型語(yǔ)言模型的推理能...
閱讀原文

無(wú)懼圖像中的文字,TextDiffuser提供更高質(zhì)量文本渲染

機(jī)器之心專(zhuān)欄機(jī)器之心編輯部近幾年來(lái),Text-to-Image 領(lǐng)域取得了巨大的進(jìn)展,特別是在 AIGC(Artificial Intelligence Generated Content)的時(shí)代。隨著 DALL...
閱讀原文

生成式AI如何可控?谷歌DARPA等最新《識(shí)別并緩解生成式人工智能的安全風(fēng)險(xiǎn)》綜述,詳述GenAI技術(shù)安全性

來(lái)源:專(zhuān)知生成式人工智能(GenAI)技術(shù),如大型語(yǔ)言模型(LLMs)和擴(kuò)散模型,已經(jīng)改變了計(jì)算領(lǐng)域的格局。它們啟用了一些令人興奮的應(yīng)用,例如生成逼真的圖像...
閱讀原文

OpenAI DALL·E 3來(lái)了,集成ChatGPT,生圖效果太炸了

機(jī)器之心報(bào)道機(jī)器之心編輯部集成 ChatGPT 后,DALL?E 3 對(duì)上下文的理解上了一個(gè)大臺(tái)階。終于,OpenAI 的文生圖 AI 工具 DALL-E 系列迎來(lái)了最新版本 DALL?E ...
閱讀原文
119202122