AI項目和框架
Nemotron-CC
Nemotron-CC是NVIDIA團隊推出的大型預訓練數據集,能將Common Crawl數據轉化為適用于長序列預訓練的高質量語料。Nemotron-CC數據集結合分類器集成、合成數據...
NVIDIA-Ingest
NVIDIA-Ingest是英偉達開源的用于解析復雜、混亂的非結構化PDF和其他企業文檔的微服務集合。NVIDIA-Ingest能將文檔轉換為元數據和文本,便于嵌入到檢索系統中...
Emotion-LLaMA
Emotion-LLaMA是多模態情緒識別與推理模型,融合了音頻、視覺和文本輸入,通過特定情緒編碼器整合信息。模型基于修改版LLaMA,經指令調整以提升情感識別能力...
GR00T-Teleop
GR00T-Teleop是NVIDIA Isaac GR00T的一部分,用在捕獲遠程操作數據的關鍵技術。基于NVIDIA CloudXR連接Apple Vision Pro頭顯,用專門設計的人形遠程操作自定...
Riona-AI-Agent
Riona-AI-Agent是Node.js 和 TypeScript 構建的 AI 驅動的自動化工具,能與 Instagram、Twitter 和 GitHub 等社交媒體平臺進行交互。Riona-AI-Agent能生成引...
Perception-as-Control
Perception-as-Control是阿里巴巴通義實驗室推出的圖像動畫框架,能根據用戶意圖實現細粒度的運動控制。Perception-as-Control基于構建3D感知運動表示,將相...
Motion Dreamer
Motion Dreamer是香港科技大學(廣州)研究者提出的視頻生成框架,旨在生成運動合理視頻?;趦呻A段生成方式,先基于輸入圖像和運動條件生成中間運動表示,...