AI項目和框架

Retinex-Diffusion

Retinex-Diffusion是基于Retinex理論的AI圖像照明控制技術,讓圖像明暗更加自然、細膩、富有層次感。Retinex-Diffusion不需要重新訓練模型,通過識別圖像中的...
閱讀原文

EXAONE 3.0

EXAONE 3.0是LG AI Research推出的開源AI模型,具有7.8億參數,專為英語和韓語設計。EXAONE 3.0在英語和韓語的語言測試中均表現優異,在真實用例和數學編碼方...
閱讀原文

DressCode

DressCode是上??萍即髮W、賓夕法尼亞大學和Deemos科技聯合推出的3D服裝生成框架。支持用戶通過文本描述來自動生成各種風格和材質的3D服裝模型。
閱讀原文

ReSyncer

ReSyncer是清華大學和百度聯合推出的AI視頻編輯工具,通過音頻驅動生成與聲音同步的高質量嘴唇動作視頻。ReSyncer用Style-SyncFormer分析聲音并創建3D面部模...
閱讀原文

MotionClone

MotionClone是文本驅動的AI視頻動作克隆框架,通過時間注意力機制從參考視頻中克隆動作,結合文本提示詞生成新視頻。能處理復雜的全局相機運動和精細的局部肢...
閱讀原文

Mini-Monkey

Mini-Monkey是華中科技大學和華南理工大學聯合推出的輕量級多模態AI模型。采用多尺度自適應切分策略(MSAC)和尺度壓縮機制(SCM),有效解決了傳統圖像切分...
閱讀原文

MDT-A2G

MDT-A2G是復旦大學和騰訊優圖聯合推出的AI模型,專門用于根據語音內容同步生成相應的手勢動作。MDT-A2G模仿人類在交流時自然產生的手勢,計算機能更加生動和...
閱讀原文

ASAM

ASAM(Adversarial Adjustment of Segment Anything Model)是vivo公司推出的AI圖像分割模型,通過對抗性調整來增強原有SAM模型的性能。ASAM用自然對抗性示例...
閱讀原文

Falcon Mamba 7B

Falcon Mamba 7B是阿聯酋技術創新研究所(TII)推出的開源AI大模型,性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用編碼器-解碼器結構和多頭注意...
閱讀原文

Clapper

Clapper 是一款免費開源的可視化AI視頻編輯工具,由 HuggingFace 的AI前端工程師 Julian Bilcke 開發。集成多種生成式 AI 技術,用戶通過交互式、迭代和直觀...
閱讀原文

UniTalker

UniTalker是推出的音頻驅動3D面部動畫生成模型,能根據輸入的音頻生成逼真的面部動作。采用統一的多頭架構模型,用帶有不同標注的數據集,支持多語言和多種音...
閱讀原文

Grok-2

Grok-2是xAI公司推出的新一代AI模型,提供卓越的聊天、編程和推理能力。在學術基準測試中,Grok-2在GPQA、MMLU、MMLU-Pro和MATH等領域的表現超越了前代Grok-1...
閱讀原文

MagicPose

MagicPose是南加州大學和字節跳動聯合研發的AI視頻生成模型,無需任何微調,直接生成逼真的人類動作和面部表情視頻。MagicPose通過一個新穎的兩階段訓練策略...
閱讀原文

Agent Q

Agent Q是MultiOn公司聯合斯坦福大學推出的自監督代理推理和搜索框架。Agent Q融合了引導式蒙特卡洛樹搜索(MCTS)、AI自我批評和直接偏好優化(DPO)等技術...
閱讀原文

UniPortrait

UniPortrait是阿里巴巴推出的AI圖像個性化編輯工具,能將照片轉換為動漫風格,支持多人合照和換臉技術。UniPortrait通過先進的"ID嵌入"和"ID...
閱讀原文