AI項目和框架

Delta-CoMe：新型高效增量壓縮算法助力數據存儲優化與傳輸提速

Delta-CoMe是清華大學NLP實驗室聯合OpenBMB開源社區、北京大學和上海財經大學提出的新型增量壓縮算法，一個80G的A100 GPU能輕松加載多達50個7B模型，節省顯存...

閱讀原文

AI工具

12個月前

Agent-E：智能化網頁操作助手提升瀏覽效率與用戶體驗

Agent-E是基于AutoGen代理框架構建的智能自動化系統，專注于瀏覽器內的自動化操作。Agent-E基于自然語言交互，能執行填寫表單、搜索排序電商產品、定位網頁內...

閱讀原文

AI工具

12個月前

Magic Copy：智能瀏覽器摳圖工具自動識別圖像輕松實現摳圖功能

Magic Copy是開源的摳圖工具，支持Chrome瀏覽器擴展，基于Meta的Segment Anything Model技術，從圖像中自動識別并提取前景對象，并將對象復制到用戶的剪貼板...

閱讀原文

AI工具

12個月前

NSFW Detector：智能開源AI內容檢測工具，全面支持圖像、PDF及視頻文件識別

NSFW Detector（Not Safe For Work，簡稱 NSFW）是開源的檢測不適宜內容工具，NSFW Detector能識別圖像、PDF、視頻文件中的不適宜內容。工具基于Google的vit-...

閱讀原文

AI工具

12個月前

GLM-Edge：智譜端側大語言與多模態模型的創新應用與優勢分析

GLM-Edge是智譜開源的一系列端側部署優化的大語言對話模型和多模態理解模型，包含GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B。1.5...

閱讀原文

AI工具

12個月前

FlagevalMM：智源多模態模型評測框架的創新特性與應用潛力

FlagEvalMM是北京智源人工智能研究院開源的多模態模型評測框架，能全面評估處理文本、圖像、視頻等多種模態的模型，支持多種任務和指標。框架采用評測與模型...

閱讀原文

AI工具

12個月前

GLM-PC：智譜CogAgent驅動的智能視覺助手，賦能創新與效率提升

GLM-PC是智譜科技基于CogAgent視覺多模態模型開發的通用Agent，能模擬人類操作計算機，實現“無人駕駛”PC的技術探索。GLM-PC能執行預定會議、文檔處理、網頁搜...

閱讀原文

AI工具

12個月前

TryOffDiff：智能虛擬試穿技術打造個性化標準化服裝圖像

TryOffDiff（VTOFF）是基于擴散模型的新型虛擬試穿技術，用高保真服裝重建實現虛擬試穿，專注于從單張穿著者照片生成標準化的服裝圖像。與傳統的Virtual Try-...

閱讀原文

AI工具

12個月前

CodeDPO：北京大學與字節聯手打造的智能代碼生成與優化解決方案

CodeDPO是北京大學與字節跳動合作推出的代碼生成優化框架，能提升代碼模型在正確性和效率方面的表現。框架基于自生成和驗證機制，同時構建和評估代碼及其測試...

閱讀原文

AI工具

12個月前

Voice-Pro：一站式音頻處理解決方案集轉錄翻譯與語音合成于一體

Voice-Pro是開源的多功能音頻處理工具，集成語音轉文字（STT）、文本轉語音（TTS）、實時翻譯、YouTube視頻下載和人聲分離等多種功能。工具支持超過100種語言...

閱讀原文

AI工具

12個月前

Generative Omnimatte：創新視頻分解技術實現精準圖像分離與增強

Generative Omnimatte 是 Google DeepMind 等機構推出的視頻編輯技術，能將視頻智能分解為多個透明背景的RGBA圖層，每個圖層對應一個物體及其相關效果（如陰...

閱讀原文

AI工具

12個月前

Open Materials 2024：Meta推出創新開放數據集與預訓練模型助力AI發展

Open Materials 2024 (OMat24) 是Meta推出的包含超過1.1億個結構的密度泛函理論(DFT)計算的大型開放數據集，專注于無機材料的結構和成分多樣性。附帶預訓練的...

閱讀原文

AI工具

12個月前

Diffusion Self-Distillation：斯坦福大學創新零樣本定制圖像生成技術助力個性化創作

Diffusion Self-Distillation（DSD）是創新的零樣本定制圖像生成技術，用預訓練的文本到圖像擴散模型自動生成數據集，并將其微調為能進行文本條件的圖像到圖...

閱讀原文

AI工具

12個月前

Talker-Reasoner：雙思維AI代理架構：智能決策與自我學習的完美結合

Talker-Reasoner是谷歌DeepMind推出的AI代理架構，借鑒人類的認知理論，將代理分為兩個模塊：Talker和Reasoner。Talker模擬人類的快速直覺思維（System 1），...

閱讀原文

AI工具

12個月前

Devika：智能編程助手助你輕松實現復雜指令的自動化執行

Devika是開源的AI編程助手，能理解并拆分復雜指令，基于集成AI搜索和網頁瀏覽能力搜集信息，編寫代碼實現目標。Devika支持多種AI模型，具備高級規劃推理能力...

閱讀原文

AI工具

12個月前

1…102 103104105 106…156