AI項目和框架
OmniTalker
OmniTalker 是阿里巴巴發布的實時文本驅動的說話頭像生成技術,能同時處理文本、圖像、音頻和視頻等多種模態輸入,以流式方式生成自然語音響應。核心架構為 T...
DeepSeek-GRM
DeepSeek-GRM是DeepSeek和清華大學研究者共同提出的通用獎勵模型(Generalist Reward Modeling)。通過點式生成式獎勵建模(Pointwise Generative Reward Mod...
OlympicArena
OlympicArena是上海交通大學、上海AI Lab、蘇州大學和上海交通大學生成式人工智能實驗室(GAIR Lab)聯合推出的多學科認知推理基準測試框架。OlympicArena包...
BabelDOC
BabelDOC 是開源的智能 PDF 翻譯工具,專為科學論文翻譯設計。能在原文旁生成翻譯文本,形成雙語對照,無需切換窗口,方便閱讀。能完整保留數學公式、表格和...
DreamActor-M1
DreamActor-M1是字節跳動推出的先進AI圖像動畫框架,能將靜態人物照片轉化為生動的動畫視頻。采用混合引導機制,結合隱式面部表示、3D頭部球體和3D身體骨架等...
Mini DALL·E 3
Mini DALL·E 3 是北京理工大學、上海AI Lab、清華大學和香港中文大學聯合推出的交互式文本到圖像(iT2I)框架。基于自然語言與用戶進行多輪對話,實現高質量...
OThink-MR1
OThink-MR1是OPPO研究院和香港科技大學(廣州)聯合推出的多模態語言模型優化框架?;趧討B調整Kullback-Leibler(KL)散度策略(GRPO-D)和獎勵模型,提升...
EasyControl Ghibli
EasyControl Ghibli 是基于 EasyControl 框架開發的 AI 模型,已上線 Hugging Face 平臺,專注于將普通圖像轉換為吉卜力風格的圖像。僅用100張亞洲人臉照片及...
PaperBench
PaperBench是OpenAI開源的AI智能體評測基準,支持評估智能體復現頂級學術論文的能力。PaperBench要求智能體從理解論文內容到編寫代碼、執行實驗,全面展現從...
粵公網安備 44011502001135號