標(biāo)簽:文本

集成ChatGPT,蘋果AI更多功能放出!最新開發(fā)者測試版系統(tǒng)發(fā)布

新智元報(bào)道編輯:靜音 【新智元導(dǎo)讀】蘋果開發(fā)者測試版系統(tǒng)上新!更多Apple Intelligence功能已經(jīng)可用了,包括ChatGPT集成。iOS 18終于帶著ChatGPT來了。 就...
閱讀原文

Nature專業(yè)戶DeepMind又登封面,開源水印技術(shù)SynthID-Text,Gemini已經(jīng)用上了

機(jī)器之心報(bào)道 機(jī)器之心編輯部現(xiàn)如今,大型語言模型(LLM)生成的內(nèi)容已經(jīng)充斥了整個(gè)互聯(lián)網(wǎng),并且這些模型還能模仿各種類似真人的語氣和行文風(fēng)格,讓人難以分...
閱讀原文

開源兩周4.7k標(biāo)星,港大LightRAG大幅降低大模型問答成本,全面理解復(fù)雜實(shí)體依賴關(guān)系

港大黃超團(tuán)隊(duì) 投稿量子位 | 公眾號 QbitAI簡單高效的大模型檢索增強(qiáng)系統(tǒng)LightRAG,香港大學(xué)黃超團(tuán)隊(duì)最新研究成果。 開源兩周時(shí)間在GitHub上獲得將近5k標(biāo)星,...
閱讀原文

OCR-Omni來了,字節(jié)&華師統(tǒng)一多模態(tài)文字理解與生成 | NeurIPS2024

TextHarmony團(tuán)隊(duì) 投稿量子位 | 公眾號 QbitAI多模態(tài)生成新突破,字節(jié)&華師團(tuán)隊(duì)打造TextHarmony,在單一模型架構(gòu)中實(shí)現(xiàn)模態(tài)生成的統(tǒng)一,并入選NeurIPS 202...
閱讀原文

Meta Movie Gen:新的 SOTA 視頻生成模型-技術(shù)報(bào)告解讀

01背景前段時(shí)間 Meta 發(fā)布了對標(biāo) OpenAI SORA 和快手可靈的視頻生成模型 Movie Gen,這里我們進(jìn)行相關(guān)的技術(shù)解讀。本文主要聚焦在其圖像和視頻生成模型部分,...
閱讀原文

蘋果多模態(tài)模型大升級!文本密集、多圖理解,全能小鋼炮

新智元報(bào)道編輯:alan 【新智元導(dǎo)讀】近日,一向畫風(fēng)精致的「蘋果牌AI」,也推出了升級版的多模態(tài)大模型,從1B到30B參數(shù),涵蓋密集和專家混合模型,密集文本...
閱讀原文

文生圖參數(shù)量升至240億!Playground v3發(fā)布:深度融合LLM,圖形設(shè)計(jì)能力超越人類

新智元報(bào)道編輯:LRS 【新智元導(dǎo)讀】Playground Research推出了新一代文本到圖像模型PGv3,具備240億參數(shù)量,采用深度融合的大型語言模型,實(shí)現(xiàn)了在圖形設(shè)計(jì)...
閱讀原文

ECCV 2024 | 新夢幻場景生成方法,高質(zhì)量、視角一致、可編輯3D場景

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

全方位超越 Sora,Meta 最新的 AI 視頻模型到底強(qiáng)在哪里?

全能生成王這兩天,視頻生成模型領(lǐng)域因?yàn)?Meta Movie Gen 的發(fā)布,又炸開了鍋。 行業(yè)內(nèi)外感嘆最多的地方,無外乎兩點(diǎn),一是生成效果自然逼真,還能同步生成與...
閱讀原文

一鍵拯救廢片!3個(gè)在線教程,實(shí)現(xiàn)光線重塑、表情遷移、模糊圖像修復(fù)

作者:李寶珠 我們?yōu)榇蠹艺砹?3 款拯救廢片神器及其一鍵部署教程,快速 get 精致朋友圈!您的國慶假期余額已不足 2 天!旅游或是歸家探親的小伙伴是不是都...
閱讀原文

Meta版Sora深夜橫空出世,小扎放出16秒高清大片!92頁論文曝光技術(shù)細(xì)節(jié),Llama 3架構(gòu)立功

來源:機(jī)器學(xué)習(xí)研究組訂閱 毫無預(yù)兆地,Meta版Sora——Movie Gen,就在剛剛搶先上線了! Meta將其稱為「迄今最先進(jìn)的媒體基礎(chǔ)模型」。 全新上線的大殺器Movie G...
閱讀原文

Meta版Sora無預(yù)警來襲!拋棄擴(kuò)散損失,音視頻生成/畫面編輯全包,92頁論文無保留公開

夢晨 衡宇 發(fā)自 凹非寺量子位 | 公眾號 QbitAI剛剛,Meta搶在OpenAI之前推出自己的Sora——Meta Movie Gen Sora有的它都有,可創(chuàng)建不同寬高比的高清長視頻,支...
閱讀原文

mini-GPT4o來了? 能看、能聽、會說,還情感豐富的多模態(tài)全能助手EMOVA

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

666條數(shù)據(jù)教會AI寫萬字長文!模型數(shù)據(jù)集都開源

魔搭ModelScope團(tuán)隊(duì) 投稿量子位 | 公眾號 QbitAI僅需600多條數(shù)據(jù),就能訓(xùn)練自己的長輸出模型了?! 事情是醬嬸兒的—— 雖然大模型的上下文(Context)支持越來越...
閱讀原文

Meta首款多模態(tài)Llama 3.2開源!1B羊駝寶寶,跑在手機(jī)上了

新智元報(bào)道編輯:桃子 好困 【新智元導(dǎo)讀】Meta首個(gè)理解圖文的多模態(tài)Llama 3.2來了!這次,除了11B和90B兩個(gè)基礎(chǔ)版本,Meta還推出了僅有1B和3B輕量級版本,適...
閱讀原文
123422