AI項目和框架

Llama 4

Llama 4 是 Meta 推出的多模態人工智能模型。首次采用混合專家(MoE)架構,在訓練和推理時計算效率更高。Llama 4 目前有 Scout 和 Maverick 兩個版本。Scout...
閱讀原文

OmniTalker

OmniTalker 是阿里巴巴發布的實時文本驅動的說話頭像生成技術,能同時處理文本、圖像、音頻和視頻等多種模態輸入,以流式方式生成自然語音響應。核心架構為 T...

DeepSeek-GRM

DeepSeek-GRM是DeepSeek和清華大學研究者共同提出的通用獎勵模型(Generalist Reward Modeling)。通過點式生成式獎勵建模(Pointwise Generative Reward Mod...
閱讀原文

OlympicArena

OlympicArena是上海交通大學、上海AI Lab、蘇州大學和上海交通大學生成式人工智能實驗室(GAIR Lab)聯合推出的多學科認知推理基準測試框架。OlympicArena包...
閱讀原文

BabelDOC

BabelDOC 是開源的智能 PDF 翻譯工具,專為科學論文翻譯設計。能在原文旁生成翻譯文本,形成雙語對照,無需切換窗口,方便閱讀。能完整保留數學公式、表格和...

DreamActor-M1

DreamActor-M1是字節跳動推出的先進AI圖像動畫框架,能將靜態人物照片轉化為生動的動畫視頻。采用混合引導機制,結合隱式面部表示、3D頭部球體和3D身體骨架等...
閱讀原文

Mini DALL·E 3

Mini DALL·E 3 是北京理工大學、上海AI Lab、清華大學和香港中文大學聯合推出的交互式文本到圖像(iT2I)框架。基于自然語言與用戶進行多輪對話,實現高質量...
閱讀原文

WorldScore

WorldScore 是斯坦福大學提出的用于世界生成模型的統一評估基準。將世界生成分解為一系列的下一個場景生成任務,通過明確的基于相機軌跡的布局規范來實現不同...
閱讀原文

SWEET-RL

SWEET-RL是Meta推出的多輪強化學習框架,專門用在訓練大型語言模型(LLM)代理進行協作推理任務。SWEET-R基于訓練時的額外信息(如參考解決方案)優化“批評者...
閱讀原文

OThink-MR1

OThink-MR1是OPPO研究院和香港科技大學(廣州)聯合推出的多模態語言模型優化框架?;趧討B調整Kullback-Leibler(KL)散度策略(GRPO-D)和獎勵模型,提升...
閱讀原文

DeepSite

DeepSite 是基于 DeepSeek-V3 模型的在線開發工具,用戶無需配置環境或安裝軟件,在網頁上直接輸入需求,快速生成游戲、應用或網頁的代碼,支持實時預覽效果。
閱讀原文

EasyControl Ghibli

EasyControl Ghibli 是基于 EasyControl 框架開發的 AI 模型,已上線 Hugging Face 平臺,專注于將普通圖像轉換為吉卜力風格的圖像。僅用100張亞洲人臉照片及...
閱讀原文

Dolphin

Dolphin是清華大學電子工程系語音與音頻技術實驗室聯合海天瑞聲共同推出的面向東方語言的語音大模型。支持40個東方語種的語音識別,中文語種涵蓋22種方言(含...
閱讀原文

PaperBench

PaperBench是OpenAI開源的AI智能體評測基準,支持評估智能體復現頂級學術論文的能力。PaperBench要求智能體從理解論文內容到編寫代碼、執行實驗,全面展現從...

AutoAgent

AutoAgent 是香港大學推出的零代碼、自動化 LLM 智能體框架。基于自然語言交互,讓用戶無需編程即可創建智能助手,適用于智能搜索、數據分析、報告生成等場景...
閱讀原文
15253545556155