AI項目和框架

Goedel-Prover

Goedel-Prover(哥德爾證明器)是普林斯頓大學、清華大學、清華大學等機構推出的開源大型語言模型(LLM),用在自動化數學問題的形式證明生成。基于將自然語...
閱讀原文

RWKV-7-2.9B

RWKV-7-2.9B模型(RWKV-7-World-2.9B-V3) 是RWKV 基金推出的先進 RNN 大語言模型。基于 RWKV World V3 數據集訓練,具有 29 億參數,支持世界所有語言。模型...
閱讀原文

AxBench

AxBench 是斯坦福大學推出的評估語言模型(LM)控制方法的基準測試框架。基于合成數據生成訓練和評估數據,比較不同模型控制技術在概念檢測和模型轉向兩個方...
閱讀原文

Lumina-Video

Lumina-Video是上海 AI Lab 和香港中文大學推出的視頻生成框架,基于Next-DiT架構,針對視頻生成中的時空復雜性進行優化。基于多尺度Next-DiT架構,用不同大...
閱讀原文

Pippo

Pippo是Meta Reality Labs推出的圖像到視頻生成模型,能從單張照片生成1K分辨率的多視角高清人像視頻。模型基于多視角擴散變換器,預訓練了30億張人像圖像,...
閱讀原文

Animate Anyone 2

Animate Anyone 2 是阿里巴巴集團通義實驗室推出的高保真角色圖像動畫生成技術,通過結合環境信息生成更具真實感的角色動畫。與傳統方法不同,能從視頻中提取...
閱讀原文

AuraFusion360

AuraFusion360是用于360°無邊界場景修復的新型基于參考的方法,主要用于虛擬現實和建筑可視化等領域的三維場景修復。通過高斯散射表示的3D場景,實現了高質量...
閱讀原文

Zonos

Zonos是Zyphra推出的高保真文本到語音(TTS)模型。Zonos包含兩個模型:16億參數的Transformer模型和SSM混合模型,均在Apache 2.0許可下開源。Zonos根據文本...
閱讀原文

ProtGPS

ProtGPS(Protein Localization Prediction Model)是麻省理工學院(MIT)和懷特黑德生物醫學研究所推出的,基于深度學習的蛋白質語言模型,用在預測蛋白質在...
閱讀原文

potpie.ai

potpie.ai 是開源平臺,基于AI技術為代碼庫創建定制化的工程代理(Agents)。potpie.ai基于構建代碼庫的知識圖譜,深度理解代碼組件之間的關系,實現自動化代...
閱讀原文

MoMask

MoMask是創新的3D人體動作生成工具,通過生成式掩碼建模技術,能根據文本描述生成高質量的3D人體動作。MoMask采用分層量化方案,將人體運動表示為多層離散的...
閱讀原文

UltraMem

UltraMem 是字節跳動豆包大模型團隊提出的全新超稀疏模型架構,解決傳統 MoE 架構在推理時的高額訪存問題。架構通過優化內存訪問和計算效率,顯著降低推理成...
閱讀原文

HumanDiT

HumanDiT 是浙江大學和字節跳動聯合提出的姿態引導的高保真人體視頻生成框架。基于擴散變換器(Diffusion Transformer,DiT),能在大規模數據集上訓練,生成...
閱讀原文

TPO

TPO(Test-Time Preference Optimization)是新型的AI優化框架,在推理階段對語言模型輸出進行動態優化,更符合人類偏好。TPO通過將獎勵信號轉化為文本反饋,...
閱讀原文

PDF to Podcast

PDF to Podcast是NVIDIA推出的PDF轉音頻的AI工具,基于NVIDIA NIM微服務架構的,能將PDF文檔轉換為生動的音頻內容,如播客。基于大型語言模型(LLM)、文本到...
閱讀原文
16566676869146