標(biāo)簽:文本
大模型×文本水印:清華、港中文、港科廣、UIC、北郵聯(lián)合發(fā)布首個(gè)大模型時(shí)代下的文本水印綜述
機(jī)器之心專欄 機(jī)器之心編輯部本文介紹首個(gè)大模型時(shí)代下的文本水印綜述,由清華、港中文、港科廣、UIC、北郵聯(lián)合發(fā)布,全面闡述了大模型時(shí)代下文本水印技術(shù)的...
畫個(gè)框、輸入文字,面包即刻出現(xiàn):AI開始在3D場景「無中生有」了
機(jī)器之心報(bào)道 編輯:陳萍現(xiàn)在,通過文本提示和一個(gè) 2D 邊界框,我們就能在 3D 場景中生成對象。看到下面這張圖了沒?一開始,盤子里是沒有東西的,但當(dāng)你在托...
世界頂尖多模態(tài)大模型開源!又是零一萬物,又是李開復(fù)
允中 發(fā)自 凹非寺量子位 | 公眾號 QbitAI領(lǐng)跑中英文兩大權(quán)威榜單,李開復(fù)零一萬物交出多模態(tài)大模型答卷! 距離其首款開源大模型Yi-34B和Yi-6B的發(fā)布,僅間隔...
零一萬物Yi-VL多模態(tài)大模型開源,MMMU、CMMMU兩大權(quán)威榜單領(lǐng)先
機(jī)器之心發(fā)布 機(jī)器之心編輯部1 月 22 日,零一萬物 Yi 系列模型家族迎來新成員:Yi Vision Language(Yi-VL)多模態(tài)語言大模型正式面向全球開源。據(jù)悉,Yi-VL...
一張照片,為深度學(xué)習(xí)巨頭們定制人像圖片
機(jī)器之心專欄 作者:InstantX 團(tuán)隊(duì)主題驅(qū)動的文本到圖像生成,通常需要在多張包含該主題(如人物、風(fēng)格)的數(shù)據(jù)集上進(jìn)行訓(xùn)練,這類方法中的代表工作包括 Drea...
今日Arxiv最熱NLP大模型論文:LLM化身符號邏輯大師,智能體文本游戲新紀(jì)元
夕小瑤科技說 原創(chuàng)作者 | 賽博馬良本期論文解讀非人類撰寫,全文由賽博馬良「AI論文解讀達(dá)人」智能體自主完成,經(jīng)人工審核后發(fā)布。智能體傳送門: https://ww...
多模態(tài)訓(xùn)練,怎么對齊不同模態(tài)?
直播預(yù)告 | 1月22日晚7點(diǎn),「自動駕駛新青年講座」第35講正式開講,LMDrive一作、香港中文大學(xué)MMLab在讀博士邵昊將主講《LMDrive:大語言模型加持的閉環(huán)端到...
今日Arxiv最熱NLP大模型論文:MIT推出新方法,大幅提升LLMs的連貫性、準(zhǔn)確性和可更新性!
夕小瑤科技說 原創(chuàng)作者 | 賽博馬良本期論文解讀非人類撰寫,全文由賽博馬良「AI論文解讀達(dá)人」智能體自主完成,經(jīng)人工審核后發(fā)布。 智能體傳送門: https://w...
20%的楊冪+80%的泰勒長什么樣?小紅書風(fēng)格化AI來了,可兼容SD和ControlNet
豐色 發(fā)自 凹非寺量子位 | 公眾號 QbitAI不得不說,現(xiàn)在拍寫真真是“簡單到放肆”了。 真人不用出鏡,不用費(fèi)心凹姿勢、搞發(fā)型,只需一張本人圖像,等待幾秒鐘,...
字節(jié)最新文生視頻模型,引發(fā)圍觀!狐貍跳舞超絲滑,效果超Gen-2
夕小瑤科技說 原創(chuàng)作者 | 謝年年、python擴(kuò)散模型帶動了文生視頻領(lǐng)域的發(fā)展。Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion model等模型在...
GPT-5前瞻!艾倫人工智能研究所發(fā)布最強(qiáng)多模態(tài)模型,預(yù)測GPT-5新能力
新智元報(bào)道編輯:alan 【新智元導(dǎo)讀】近日,艾倫人工智能研究所發(fā)布了Unified-IO 2,——第一代Unified-IO曾預(yù)測了GPT-4等模型的能力,所以我們可以從新一代的...
騰訊 PCG ARC Lab、新加坡國立大合發(fā)布 M2UGen:基于 LLM 的多模態(tài)音樂理解與生成
在過去的一年里,基于大語言模型LLM的音樂AIGC技術(shù)蓬勃發(fā)展,為LLM的下游應(yīng)用注入了新的活力。 本研究成果M2UGen致力于將LLM和音樂理解與音樂生成技術(shù)相結(jié)合...
四行代碼讓大模型上下文暴增3倍,羊駝Mistral都適用
克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAI無需微調(diào),只要四行代碼就能讓大模型窗口長度暴增,最高可增加3倍! 而且是“即插即用”,理論上可以適配任意大模型...
微軟最新研究成果:使用GPT-4合成數(shù)據(jù)來訓(xùn)練AI模型,實(shí)現(xiàn)SOTA!
夕小瑤科技說 原創(chuàng)作者 | 謝年年、王二狗文本嵌入是各項(xiàng)NLP任務(wù)的基礎(chǔ),用于將自然語言轉(zhuǎn)換為向量表示。現(xiàn)有的大部分方法通常采用復(fù)雜的多階段訓(xùn)練流程,先在...
新加坡國立大學(xué)發(fā)布圖文預(yù)訓(xùn)練框架 CosMo,助力長文本理解
夕小瑤科技說 原創(chuàng)作者 | 智商掉了一地、Python近年來,隨著大型語言模型(LLM)的興起,讓多模態(tài)學(xué)習(xí)領(lǐng)域也得到了不斷發(fā)展。本文作者深入探討了視覺-語言預(yù)...
粵公網(wǎng)安備 44011502001135號