AI項目和框架

Nemotron-CC

Nemotron-CC是NVIDIA團隊推出的大型預訓練數據集,能將Common Crawl數據轉化為適用于長序列預訓練的高質量語料。Nemotron-CC數據集結合分類器集成、合成數據...
閱讀原文

NVIDIA-Ingest

NVIDIA-Ingest是英偉達開源的用于解析復雜、混亂的非結構化PDF和其他企業文檔的微服務集合。NVIDIA-Ingest能將文檔轉換為元數據和文本,便于嵌入到檢索系統中...
閱讀原文

Eko

Eko是Fellou AI推出的生產就緒型JavaScript框架,基于自然語言驅動的方式,幫助開發者輕松創建從簡單指令到復雜流程的可靠智能代理。Eko支持所有平臺,包括計...
閱讀原文

Emotion-LLaMA

Emotion-LLaMA是多模態情緒識別與推理模型,融合了音頻、視覺和文本輸入,通過特定情緒編碼器整合信息。模型基于修改版LLaMA,經指令調整以提升情感識別能力...
閱讀原文

GR00T-Teleop

GR00T-Teleop是NVIDIA Isaac GR00T的一部分,用在捕獲遠程操作數據的關鍵技術。基于NVIDIA CloudXR連接Apple Vision Pro頭顯,用專門設計的人形遠程操作自定...
閱讀原文

MiniRAG

MiniRAG是香港大學推出的新型檢索增強型生成(RAG)系統,專為在資源受限的場景下高效部署小型語言模型(SLMs)設計。MiniRAG基于兩個關鍵技術實現這一目標:...
閱讀原文

Riona-AI-Agent

Riona-AI-Agent是Node.js 和 TypeScript 構建的 AI 驅動的自動化工具,能與 Instagram、Twitter 和 GitHub 等社交媒體平臺進行交互。Riona-AI-Agent能生成引...
閱讀原文

新言意碼

新言意碼是專注于AI編程應用開發的公司,由前月之暗面海外產品Noisee的明超平創立。公司全稱深圳新言意碼科技有限公司,成立于2024年9月23日,位于廣東省深圳...
閱讀原文

PPTAgent

PPTAgent是中國科學院軟件研究所中文信息處理實驗室推出的創新框架,基于模仿人類工作流程的兩階段編輯方法,從文檔自動生成高質量的演示文稿。PPTAgent分析...
閱讀原文

HoloDrive

HoloDrive 是商湯和上海人工智能實驗室等機構提出的用于自動駕駛的整體2D-3D多模態街道場景生成框架??蚣苈摵仙上鄼C圖像和激光雷達點云,填補自動駕駛中2D...
閱讀原文

Perception-as-Control

Perception-as-Control是阿里巴巴通義實驗室推出的圖像動畫框架,能根據用戶意圖實現細粒度的運動控制。Perception-as-Control基于構建3D感知運動表示,將相...
閱讀原文

Motion Dreamer

Motion Dreamer是香港科技大學(廣州)研究者提出的視頻生成框架,旨在生成運動合理視頻?;趦呻A段生成方式,先基于輸入圖像和運動條件生成中間運動表示,...
閱讀原文

Sky-T1

Sky-T1是加州大學伯克利分校Sky Computing實驗室的研究團隊NovaSky發布的開源推理AI模型,名為Sky-T1-32B-Preview。是首個開源推理模型,訓練數據集和代碼均...
閱讀原文

FaceLift

FaceLift是Adobe和加州大學默塞德分校推出的單圖像到3D頭部模型的轉換技術,能從單一的人臉圖像中重建出360度的頭部模型。FaceLift基于兩階段的流程實現:基...
閱讀原文

SVFR

SVFR(Stable Video Face Restoration)是騰訊優圖實驗室和廈門大學聯合推出的用于廣義視頻人臉修復的統一框架,整合了視頻人臉修復(BFR)、著色和修復任務...
閱讀原文
17172737475146