標簽:文本

大模型×文本水印:清華、港中文、港科廣、UIC、北郵聯合發布首個大模型時代下的文本水印綜述

機器之心專欄 機器之心編輯部本文介紹首個大模型時代下的文本水印綜述,由清華、港中文、港科廣、UIC、北郵聯合發布,全面闡述了大模型時代下文本水印技術的...
閱讀原文

畫個框、輸入文字,面包即刻出現:AI開始在3D場景「無中生有」了

機器之心報道 編輯:陳萍現在,通過文本提示和一個 2D 邊界框,我們就能在 3D 場景中生成對象。看到下面這張圖了沒?一開始,盤子里是沒有東西的,但當你在托...
閱讀原文

世界頂尖多模態大模型開源!又是零一萬物,又是李開復

允中 發自 凹非寺量子位 | 公眾號 QbitAI領跑中英文兩大權威榜單,李開復零一萬物交出多模態大模型答卷! 距離其首款開源大模型Yi-34B和Yi-6B的發布,僅間隔...
閱讀原文

零一萬物Yi-VL多模態大模型開源,MMMU、CMMMU兩大權威榜單領先

機器之心發布 機器之心編輯部1 月 22 日,零一萬物 Yi 系列模型家族迎來新成員:Yi Vision Language(Yi-VL)多模態語言大模型正式面向全球開源。據悉,Yi-VL...
閱讀原文

一張照片,為深度學習巨頭們定制人像圖片

機器之心專欄 作者:InstantX 團隊主題驅動的文本到圖像生成,通常需要在多張包含該主題(如人物、風格)的數據集上進行訓練,這類方法中的代表工作包括 Drea...
閱讀原文

今日Arxiv最熱NLP大模型論文:LLM化身符號邏輯大師,智能體文本游戲新紀元

夕小瑤科技說 原創作者 | 賽博馬良本期論文解讀非人類撰寫,全文由賽博馬良「AI論文解讀達人」智能體自主完成,經人工審核后發布。智能體傳送門: https://ww...
閱讀原文

多模態訓練,怎么對齊不同模態?

直播預告 | 1月22日晚7點,「自動駕駛新青年講座」第35講正式開講,LMDrive一作、香港中文大學MMLab在讀博士邵昊將主講《LMDrive:大語言模型加持的閉環端到...
閱讀原文

今日Arxiv最熱NLP大模型論文:MIT推出新方法,大幅提升LLMs的連貫性、準確性和可更新性!

夕小瑤科技說 原創作者 | 賽博馬良本期論文解讀非人類撰寫,全文由賽博馬良「AI論文解讀達人」智能體自主完成,經人工審核后發布。 智能體傳送門: https://w...
閱讀原文

20%的楊冪+80%的泰勒長什么樣?小紅書風格化AI來了,可兼容SD和ControlNet

豐色 發自 凹非寺量子位 | 公眾號 QbitAI不得不說,現在拍寫真真是“簡單到放肆”了。 真人不用出鏡,不用費心凹姿勢、搞發型,只需一張本人圖像,等待幾秒鐘,...
閱讀原文

字節最新文生視頻模型,引發圍觀!狐貍跳舞超絲滑,效果超Gen-2

夕小瑤科技說 原創作者 | 謝年年、python擴散模型帶動了文生視頻領域的發展。Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion model等模型在...
閱讀原文

GPT-5前瞻!艾倫人工智能研究所發布最強多模態模型,預測GPT-5新能力

新智元報道編輯:alan 【新智元導讀】近日,艾倫人工智能研究所發布了Unified-IO 2,——第一代Unified-IO曾預測了GPT-4等模型的能力,所以我們可以從新一代的...
閱讀原文

騰訊 PCG ARC Lab、新加坡國立大合發布 M2UGen:基于 LLM 的多模態音樂理解與生成

在過去的一年里,基于大語言模型LLM的音樂AIGC技術蓬勃發展,為LLM的下游應用注入了新的活力。 本研究成果M2UGen致力于將LLM和音樂理解與音樂生成技術相結合...
閱讀原文

四行代碼讓大模型上下文暴增3倍,羊駝Mistral都適用

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI無需微調,只要四行代碼就能讓大模型窗口長度暴增,最高可增加3倍! 而且是“即插即用”,理論上可以適配任意大模型...
閱讀原文

微軟最新研究成果:使用GPT-4合成數據來訓練AI模型,實現SOTA!

夕小瑤科技說 原創作者 | 謝年年、王二狗文本嵌入是各項NLP任務的基礎,用于將自然語言轉換為向量表示。現有的大部分方法通常采用復雜的多階段訓練流程,先在...
閱讀原文

新加坡國立大學發布圖文預訓練框架 CosMo,助力長文本理解

夕小瑤科技說 原創作者 | 智商掉了一地、Python近年來,隨著大型語言模型(LLM)的興起,讓多模態學習領域也得到了不斷發展。本文作者深入探討了視覺-語言預...
閱讀原文
1131415161722