AI項目和框架

RAGEN

RAGEN是開源的強化學習框架,用于在交互式、隨機環境中訓練大型語言模型(LLM)推理Agent。基于StarPO(State-Thinking-Action-Reward Policy Optimization)...
閱讀原文

Cooragent

Cooragent是由清華大學LeapLab團隊推出的開源AI Agent協作框架。用戶基于簡單的一句話描述快速創建Agent,支持Agent之間的協作,完成復雜任務。Cooragent基于...
閱讀原文

DAM-3B

DAM-3B(Describe Anything 3B)是英偉達推出的多模態大語言模型,專為生成圖像和視頻中特定區域的詳細描述設計。模型通過點、邊界框、涂鴉或掩碼等方式指定...
閱讀原文

Skywork-R1V 2.0

Skywork-R1V 2.0 是昆侖萬維最新開源的多模態推理模型,專為復雜推理任務設計,具備強大的視覺與文本推理能力。模型基于混合強化學習和多模態獎勵模型(Skywo...
閱讀原文

Flex.2-preview

Flex.2-preview 是Ostris開源的 80 億參數文本到圖像擴散模型,支持通用控制輸入(如線條、姿態、深度)和內置修復功能。模型基于一個模型滿足多種創意需求,...
閱讀原文

GPT-image-1

GPT-image-1是OpenAI推出的原生多模態圖像生成模型,基于API向開發者開放使用。模型根據文本提示和圖像生成高質量、專業級的圖像,支持多種風格和自定義功能...
閱讀原文

Eagle 2.5

Eagle 2.5是英偉達推出的視覺語言模型,專注于長上下文多模態學習的 AI 模型,參數規模僅為 8B。參數量較小,但在處理高分辨率圖像和長視頻序列方面表現出色...
閱讀原文

Miras

Miras是谷歌推出的用在深度學習架構設計的通用框架,特別是序列建模任務。Miras基于關聯記憶和注意力偏差的概念,將Transformer、現代線性RNN等模型重新定義...
閱讀原文

SocioVerse

SocioVerse(眾生) 是復旦大學、上海創智學院、羅切斯特大學和小紅書聯合推出的社會模擬世界模型。基于大語言模型(LLM)驅動的智能體和包含1000萬真實用戶...
閱讀原文

Pad.ws

Pad.ws 是創新的在線開發環境,結合了白板功能與完整的 IDE 工具。基于瀏覽器運行,無需安裝額外軟件,用戶可以隨時隨地通過任何設備訪問。將交互式白板與代...
閱讀原文

UFO2

UFO2 是微軟推出的面向 Windows 桌面的多Agent操作系統(AgentOS),基于深度系統集成和自然語言交互實現復雜桌面任務的自動化。UFO2基于中央 HostAgent 分解...
閱讀原文

AvatarFX

AvatarFX 是 Character.AI 推出的先進 AI 視頻生成模型。基于上傳一張圖片和選擇聲音,讓角色瞬間“活起來”,實現說話、唱歌和表達情感。AvatarFX支持多角色、...
閱讀原文

混元3D v2.5

混元3D v2.5是騰訊推出的新一代3D生成模型,在建模精細度上大幅提升,總參數量從1B提升至10B,有效面片數增加超10倍,有效幾何分辨率達到1024,實現超高清的...
閱讀原文

SurveyGO

SurveyGO(卷姬) 是面壁智能團隊開源的AI論文寫作工具。支持根據用戶輸入的論文主題和描述,快速生成結構清晰、內容豐富的綜述文章,幫助科研人員和學生高效...
閱讀原文

Suna

Suna 是Kortix推出的全球首款通用型 AI Agent 開源項目,支持高效解決現實場景中的各類任務。基于自然流暢的對話交互,Suna 支持智能輔助研究分析、數據處理...
閱讀原文
189101112117