AI項目和框架

AG-UI

AG-UI(Agent-User Interaction Protocol)是開源的、輕量級的、基于事件的協議,支持標準化AI Agent 與前端應用之間的交互。AG-UI定義16種標準事件類型,支...
閱讀原文

Minion Agent

Minion Agent是Agent框架,支持瀏覽器操作、MCP、自動規劃和深度研究等功能。Minion Agent支持多種模型,基于靈活的配置選項滿足不同需求。
閱讀原文

OpenVision

OpenVision是加州大學圣克魯茲分校(UCSC)推出的完全開放、高效且靈活的高級視覺編碼器家族,專注于多模態學習。提供從5.9M到632.1M參數的多種規模模型,適...
閱讀原文

FLUX-Text

FLUX-Text 是阿里推出的新型的多語言場景文本編輯框架,基于擴散模型(Diffusion Model)和輕量級字形嵌入模塊。框架基于注入字形條件信息,提升復雜場景下文...
閱讀原文

MCA-Ctrl

MCA-Ctrl(Multi-party Collaborative Attention Control)是中科院計算所和中國科學院大學的推出的圖像定制生成框架,基于文本和復雜視覺條件實現高質量的圖...
閱讀原文

AgentCPM-GUI

AgentCPM-GUI 是清華大學和面壁智能團隊聯合推出的開源端側 GUI Agent ,針對中文應用優化。模型基于 MiniCPM-V(80 億參數)構建,能接受智能手機截圖作為輸...
閱讀原文

Nexus-Gen

Nexus-Gen 是魔搭團隊、華東師范大學等機構推出的開源全能圖像生成模型,支持同時完成圖像理解、生成和編輯任務。Nexus-Gen融合強大的語言模型與擴散模型的能...
閱讀原文

StreamBridge

StreamBridge 是蘋果公司與復旦大學聯合推出的端側視頻大語言模型(Video-LLMs)框架,能幫助 AI 實時理解直播流視頻。框架基于內存緩沖區和輪次衰減壓縮策略...
閱讀原文

Step1X-3D

Step1X-3D 是StepFun聯合LightIllusions推出的高保真、可控的 3D 資產生成框架。基于嚴格的數據整理流程,從超過 500 萬個 3D 資產中篩選出 200 萬個高質量數...
閱讀原文

Seedance 1.0 lite

Seedance 1.0 lite是火山引擎推出的豆包視頻生成模型的小參數量版本,支持文生視頻和圖生視頻兩種生成方式,支持生成5秒或10秒、480p或720p分辨率的視頻。
閱讀原文

MCPHub

MCPHub是一站式MCP(模型上下文協議)服務器聚合平臺。支持將多個MCP服務器整合到不同的流式HTTP(SSE)端點,基于直觀的Web界面和強大的協議處理能力,簡化A...
閱讀原文

Co-Sight

Co-Sight是中興通訊開源的超級智能體項目,為協同視覺分析平臺及智能自動化底座。采用多智能體架構,構建“數字團隊”協同體系,通過DAG任務引擎驅動,實現任務...
閱讀原文

HealthBench

HealthBench是OpenAI推出的醫療開源測試基準,用在評估大型語言模型(LLMs)在醫療保健領域的表現和安全性。HealthBench包含5000個模型與用戶或醫療專業人員...
閱讀原文

Chinese-LiPS

Chinese-LiPS 是智源研究院聯合南開大學共同打造的高質量中文多模態語音識別數據集,包含100小時的語音、視頻和手動轉錄文本,創新性地融合了唇讀視頻和演講...
閱讀原文

ViLAMP

ViLAMP(VIdeo-LAnguage Model with Mixed Precision)是螞蟻集團和中國人民大學聯合推出的視覺語言模型,專門用在高效處理長視頻內容。基于混合精度策略,對...
閱讀原文
13031323334146