AI項目和框架

MultiFoley:創新音效生成系統助力創作者實現無限靈感

MultiFoley是Adobe Research和密歇根大學共同推出的音效生成系統,能基于文本、音頻和視頻的多模態控制生成Foley聲音效果。系統支持用戶根據文本提示、參考音...
閱讀原文

CAT4D:基于單目視頻技術的創新4D場景生成方法解析

CAT4D是Google DeepMind、哥倫比亞大學和加州大學圣地亞哥分校共同推出的,能從單目視頻創建4D場景(動態3D)表示。CAT4D基于多視圖視頻擴散模型,能在任意指...
閱讀原文

Make-It-Animatable:中科大與騰訊聯手打造智能即時動畫生成資產系統

Make-It-Animatable是中國科學技術大學和Tencent PCG推出的數據驅動框架,能在不到一秒鐘內讓任何3D人形模型準備好進行角色動畫狀態,無論其形狀和姿勢如何。...
閱讀原文

Delta-CoMe:新型高效增量壓縮算法助力數據存儲優化與傳輸提速

Delta-CoMe是清華大學NLP實驗室聯合OpenBMB開源社區、北京大學和上海財經大學提出的新型增量壓縮算法,一個80G的A100 GPU能輕松加載多達50個7B模型,節省顯存...
閱讀原文

Agent-E:智能化網頁操作助手提升瀏覽效率與用戶體驗

Agent-E是基于AutoGen代理框架構建的智能自動化系統,專注于瀏覽器內的自動化操作。Agent-E基于自然語言交互,能執行填寫表單、搜索排序電商產品、定位網頁內...
閱讀原文

Magic Copy:智能瀏覽器摳圖工具自動識別圖像輕松實現摳圖功能

Magic Copy是開源的摳圖工具,支持Chrome瀏覽器擴展,基于Meta的Segment Anything Model技術,從圖像中自動識別并提取前景對象,并將對象復制到用戶的剪貼板...
閱讀原文

NSFW Detector:智能開源AI內容檢測工具,全面支持圖像、PDF及視頻文件識別

NSFW Detector(Not Safe For Work,簡稱 NSFW)是開源的檢測不適宜內容工具,NSFW Detector能識別圖像、PDF、視頻文件中的不適宜內容。工具基于Google的vit-...
閱讀原文

GLM-Edge:智譜端側大語言與多模態模型的創新應用與優勢分析

GLM-Edge是智譜開源的一系列端側部署優化的大語言對話模型和多模態理解模型,包含GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B。1.5...
閱讀原文

FlagevalMM:智源多模態模型評測框架的創新特性與應用潛力

FlagEvalMM是北京智源人工智能研究院開源的多模態模型評測框架,能全面評估處理文本、圖像、視頻等多種模態的模型,支持多種任務和指標。框架采用評測與模型...
閱讀原文

GLM-PC:智譜CogAgent驅動的智能視覺助手,賦能創新與效率提升

GLM-PC是智譜科技基于CogAgent視覺多模態模型開發的通用Agent,能模擬人類操作計算機,實現“無人駕駛”PC的技術探索。GLM-PC能執行預定會議、文檔處理、網頁搜...
閱讀原文

TryOffDiff:智能虛擬試穿技術打造個性化標準化服裝圖像

TryOffDiff(VTOFF)是基于擴散模型的新型虛擬試穿技術,用高保真服裝重建實現虛擬試穿,專注于從單張穿著者照片生成標準化的服裝圖像。與傳統的Virtual Try-...
閱讀原文

CodeDPO:北京大學與字節聯手打造的智能代碼生成與優化解決方案

CodeDPO是北京大學與字節跳動合作推出的代碼生成優化框架,能提升代碼模型在正確性和效率方面的表現。框架基于自生成和驗證機制,同時構建和評估代碼及其測試...
閱讀原文

Voice-Pro:一站式音頻處理解決方案集轉錄翻譯與語音合成于一體

Voice-Pro是開源的多功能音頻處理工具,集成語音轉文字(STT)、文本轉語音(TTS)、實時翻譯、YouTube視頻下載和人聲分離等多種功能。工具支持超過100種語言...
閱讀原文

Generative Omnimatte:創新視頻分解技術實現精準圖像分離與增強

Generative Omnimatte 是 Google DeepMind 等機構推出的視頻編輯技術,能將視頻智能分解為多個透明背景的RGBA圖層,每個圖層對應一個物體及其相關效果(如陰...
閱讀原文

Open Materials 2024:Meta推出創新開放數據集與預訓練模型助力AI發展

Open Materials 2024 (OMat24) 是Meta推出的包含超過1.1億個結構的密度泛函理論(DFT)計算的大型開放數據集,專注于無機材料的結構和成分多樣性。附帶預訓練的...
閱讀原文
19293949596146