AI項目和框架

MindOmni

MindOmni 是騰訊 ARC Lab 聯合清華大學深圳國際研究生院、香港中文大學和香港大學等推出的多模態大型語言模型,基于強化學習算法(RGPO)顯著提升視覺語言模...
閱讀原文

盤古大模型 5.5

盤古大模型5.5是華為在開發者大會(HDC 2025)上發布的最新一代人工智能大模型。模型強調“不作詩,只做事”,專注于解決實際產業問題,推動千行百業的智能化升...
閱讀原文

Stream-Omni

Stream-Omni是中國科學院計算技術研究所智能信息處理重點實驗室、中國科學院人工智能安全重點實驗室及中國科學院大學聯合推出的類似GPT-4o的大型語言視覺語音...
閱讀原文

OneRec

OneRec 是快手推出的新型端到端生成式推薦系統。采用編碼器-解碼器架構,通過稀疏 Mixture-of-Experts(MoE)技術提升模型容量,保持高效的計算性能。與傳統...
閱讀原文

Kimi-Researcher

Kimi-Researcher 是月之暗面旗下的 Kimi 推出的基于端到端自主強化學習(end-to-end agentic RL)技術訓練的新一代 Agent 模型,專為深度研究任務而設計。能...
閱讀原文

Self Forcing

Self Forcing 是 Adobe Research 與德克薩斯大學奧斯汀分校聯合推出的新型自回歸視頻生成算法,解決傳統生成模型在訓練與測試時的暴露偏差問題。通過在訓練階...
閱讀原文

SongGeneration

SongGeneration是騰訊AI Lab推出的AI音樂生成大模型。模型支持解決音樂AIGC領域中的音質、音樂性與生成速度等關鍵問題,SongGeneration基于LLM-DiT融合架構,...
閱讀原文

Skywork-SWE-32B

Skywork-SWE-32B是昆侖萬維開源的32B規模的軟件工程(SWE)自主代碼智能體基座模型。模型專注于軟件工程任務,特別是倉庫級代碼修復能力,能在多輪交互和長文...
閱讀原文

Office-PowerPoint-MCP-Server

Office-PowerPoint-MCP-Server 是基于 Model Context Protocol(MCP)的開源工具,專門用在演示文稿的自動化創建和編輯。工具基于 python-pptx 庫實現對 Powe...
閱讀原文

MeWM

MeWM(Medical World Model)是創新的醫學模型,由香港科技大學(廣州)等機構提出,通過模擬疾病動態來輔助臨床決策。由策略模型、動態模型和逆向動態模型組...
閱讀原文

EX-4D

EX-4D是字節跳動(ByteDance)旗下Pico團隊推出的新型4D視頻生成框架,能從單目視頻輸入生成極端視角下的高質量4D視頻。框架基于獨特的深度防水網格(DW-Mesh...
閱讀原文

LinGen

LinGen是普林斯頓大學和Meta共同推出的新型文本到視頻生成框架。框架基于線性復雜度的MATE模塊(包含MA-branch和TE-branch),替換傳統Diffusion Transformer...
閱讀原文

Midjourney V1

Midjourney V1 是 Midjourney 公司推出的首個AI視頻生成模型。支持用戶將靜態圖像轉化為動態視頻。用戶上傳圖片或在 Midjourney 中生成圖片基于“Animate”按鈕...
閱讀原文

EmbodiedGen

EmbodiedGen 是用于具身智能(Embodied AI)應用的生成式 3D 世界引擎和工具包。能快速生成高質量、低成本且物理屬性合理的 3D 資產和交互環境,幫助研究人員...
閱讀原文

SurveyForge

SurveyForge是上海AI Lab聯合復旦大學、上海交通大學等機構推出的創新框架,用在自動化生成高質量學術綜述。框架基于兩階段設計,大綱生成和內容生成。在大綱...
閱讀原文
12829303132155