AI項目和框架
Motion Anything
Motion Anything 是澳大利亞國立大學(xué)、悉尼大學(xué)、騰訊、麥吉爾大學(xué)、京東等機構(gòu)推出的多模態(tài)運動生成框架,根據(jù)文本、音樂或兩者的組合生成高質(zhì)量、可控的人...
Reka Flash 3
Reka Flash 3 是 Reka AI 推出的開源推理模型,擁有 21 億參數(shù)。支持多模態(tài)輸入,包括文本、圖像、視頻和音頻,可處理最多 32k 個令牌的上下文長度,適用于一...
MM-StoryAgent
MM-StoryAgent 是上海交通大學(xué)X-LANCE實驗室和阿里巴巴集團聯(lián)合推出的開源、多模態(tài)、多智能體框架,用在生成沉浸式的有聲故事繪本視頻。基于結(jié)合大型語言模型...
Deep Research Web UI
Deep Research Web UI 是開源的 AI 研究助手工具,幫助用戶高效地進行深度研究。通過 AI 驅(qū)動的迭代搜索,逐步深入挖掘指定主題,以樹狀結(jié)構(gòu)可視化研究過程,...
BEHAVIOR Robot Suite
BEHAVIOR Robot Suite(BRS)是斯坦福大學(xué)李飛飛團隊推出的用在學(xué)習(xí)全身操作完成日常家務(wù)任務(wù)的框架。基于分析家務(wù)活動,確定機器人需要具備的關(guān)鍵能力,包括...
Seedream 2.0
Seedream 2.0 是字節(jié)跳動豆包大模型團隊推出的原生中英雙語圖像生成模型,解決現(xiàn)有模型在文本渲染、文化理解等方面的不足。模型通過自研的雙語大語言模型(LL...
GaussianAnything
GaussianAnything 是南洋理工大學(xué) S-Lab 聯(lián)合上海 AI Lab 等機構(gòu)推出的 3D 生成框架。GaussianAnything 基于交互式的點云結(jié)構(gòu)化潛空間和級聯(lián)的流匹配模型,實...
DeepSeek百寶箱
DeepSeek百寶箱是 DeepSeek 團隊維護的 GitHub 項目,展示如何將 DeepSeek API 集成到各種流行軟件中。項目列出了一系列支持 DeepSeek 的工具和應(yīng)用,涵蓋了...