AI項目和框架

Napkins.dev

Napkins.dev是一個創新的開源項目,基于AI技術將用戶的截圖或線框圖快速轉換成可運行的網頁應用程序。該、項目背后依托于Meta的Llama 3.1 405B大型語言模型和...
閱讀原文

MDM

Matryoshka Diffusion Models(MDM)是由蘋果公司研究人員推出的一種新型擴散模型框架,旨在解決生成高分辨率圖像和視頻時面臨的計算和優化挑戰。MDM基于在多...
閱讀原文

mPLUG-DocOwl 1.5

mPLUG-DocOwl 1.5是由阿里巴巴集團推出的多模態大型語言模型,專注于OCR-free(無需光學字符識別)的文檔理解。模型基于統一結構學習,強化對文本豐富圖像如...
閱讀原文

Fluid

Fluid是由Google DeepMind和MIT共同推出的文本到圖像的自回歸生成模型,基于連續標記和隨機生成順序的方法,在視覺質量和評估性能上取得突破性進展。模型在擴...
閱讀原文

SaRA

SaRA是一種新型的預訓練擴散模型微調方法,由上海交通大學和騰訊優圖實驗室共同推出。基于重新激活預訓練過程中看似無效的參數,讓模型能適應新任務。SaRA基...
閱讀原文

Quanta Quest

Quanta Quest是一款面向個人用戶的開源AI時代智能數據庫產品,基于將個人數據如Gmail、Dropbox、Notion等整合到一個平臺上,用RAG技術提供AI搜索功能,幫助用...
閱讀原文

BiGR

BiGR是一種新型的條件圖像生成模型,用緊湊的二進制潛在代碼進行生成訓練,增強圖像的生成質量和表示能力。作為首個在同一框架內統一生成和判別任務的模型,B...
閱讀原文

MoE++

MoE++是一種新型的混合專家(Mixture-of-Experts)架構,由昆侖萬維2050研究院與北大袁粒團隊聯合推出。基于引入零計算量專家,即零專家、復制專家和常數專家...
閱讀原文

Granite 3.0

Granite 3.0 是 IBM 推出的一系列先進的AI模型,能在多個學術和企業基準測試中展現出卓越的性能。模型設計用在企業級應用,能執行各種任務,包括文本生成、分...
閱讀原文

Project Turntable

Project Turntable是Adobe在2024年MAX大會上推出的一款創新AI工具。工具能讓用戶像操作3D對象一樣旋轉2D矢量圖像,即時生成圖像所需的隱藏部分。用AI模型填充...
閱讀原文

OmniAI

OmniAI是一個強大的AI文檔處理平臺,基于先進的OCR技術,支持對PDF、DOCX、圖片等多種文件格式進行快速處理和數據提取。平臺支持用戶輕松創建文檔處理管道,...
閱讀原文

TaskWeaver

TaskWeaver是由微軟推出的一個代碼優先的AI智能體框架,專注于無縫規劃和執行數據分析任務。基于代碼片段解釋用戶請求,高效協調各種插件(以函數形式)執行...
閱讀原文

Stable Diffusion 3.5

Stable Diffusion 3.5是Stability AI公司最新推出的一系列先進的AI圖像生成模型,包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo和即將...
閱讀原文

Mochi 1

Mochi 1是Genmo公司推出的開源視頻生成模型,在動作質量和遵循用戶提示方面表現出色。Mochi 1基于Apache 2.0許可證發布,支持個人和商業用途的免費使用。模型...
閱讀原文

Claude 3.5 Haiku

Claude 3.5 Haiku 是 Anthropic 公司推出的一款新型人工智能模型,保持與前代 Claude 3 Haiku 相近的速度和成本的同時,實現了在各項能力上的提升,在多項基...
閱讀原文