AI項目和框架
法信法律基座大模型:法律行業新紀元的千億參數智能大模型發布
法信法律基座大模型是基于清華大學與面壁智能科研成果轉化的千億參數通用大模型,由最高人民法院發布,定位為國家級法律AI基礎設施。提供生成式AI底層能力,...
Audio Decomposition:輕松轉換音樂為五線譜的開源工具
Audio Decomposition是音頻處理技術,基于傅里葉變換和信封匹配將音樂中的各個音符和樂器分離,實現音樂到樂譜的轉換。Audio Decomposition開源項目是Matthew...
Florence-2:多功能視覺語言模型提升跨模態理解與應用能力
Florence-2 是微軟 Azure AI 團隊推出的多功能視覺模型,能執行圖像描述、目標檢測、視覺定位和圖像分割等多種計算機視覺任務。Florence-2 基于 Transformer ...
k0-math:月之暗面Kimi的創新數學推理模型引領高效決策新潮流
k0-math是月之暗面推出的最新數學推理模型,主打深入思考能力。在MATH、中考、高考、考研等數學基準測試中,k0-math的成績超過OpenAI的o1系列模型。模型基于...
MagicQuill:智能圖像編輯助手助你輕松創作與分享
MagicQuill是香港科技大學、螞蟻集團、浙江大學和香港大學共同推出的開源AI互動式圖像編輯工具。基于用戶友好的界面和AI支持的智能建議,實現精確的局部圖像...
ai-chatbot:構建高性能應用的開源AI機器人解決方案
ai-chatbot是Vercel推出的開源項目,基于Next.js框架和Vercel AI SDK構建。ai-chatbot提供一個功能完備、易于定制的AI聊天機器人模板,幫助開發者快速構建高...
LLaMA-Mesh:清華與英偉達攜手打造智能自然語言驅動的3D模型生成系統
LLaMA-Mesh是清華大學和NVIDIA共同推出的項目,基于將3D網格生成與大型語言模型(LLMs)結合,實現用文本提示直接生成3D模型的功能。項目用OBJ文件格式將3D網...
iAgents:多智能體協作創新框架推動人工智能高效協同與任務優化
iAgents是清華大學推出的多AI智能體協作框架,基于為每個用戶配備個人AI智能體促進協作和完成日常任務。智能體能理解用戶的文件、命令,從協作中學習,實現自...
DanceFusion:音頻驅動的舞蹈動作重建與生成開源框架助力創意舞蹈表達
DanceFusion是清華大學推出的開源框架,專注于音頻驅動的舞蹈動作重建與生成。DanceFusion結合分層時空Transformer-VAE和擴散模型,能處理社交媒體上的不完整...
Symphony Creative Studio:TikTok推出智能AI廣告創意視頻生成工具,輕松打造個性化廣告內容
Symphony Creative Studio是TikTok推出的AI視頻創作工具,幫助廣告主和內容創作者簡化視頻制作流程。Symphony Creative Studio集成視頻生成、轉換和擴展功能...
Skywork o1:天工大模型4.0 O1版:智能生成與多模態交互的革新體驗
Skywork o1是昆侖萬維推出的天工大模型4.0 o1版,是國內首款具備中文邏輯推理能力的o1模型。Skywork o1在模型輸出中內生了思考、計劃、反思等能力,顯著提升...
Voyage Multimodal-3:多模態嵌入模型引領AI創新實現更智能的跨領域理解與應用
Voyage Multimodal-3 是 Voyage AI 推出的先進的多模態嵌入模型,能處理交錯的文本和圖像,并從 PDF、幻燈片、表格等截圖中捕捉關鍵視覺特征,無需復雜文檔解...
Hali:多模態智能體協作解決方案提升團隊效率與創新能力
Hali是特斯聯聯合國際輕奢品牌Buttons推出的多模態多智能體協作AI Agent。Hali具備類人思考、長記憶、物理世界感知和多智能體協作四大特點,語義理解準確率超...
Agent K v1.0:全新端到端自主數據科學智能體助力智能決策與數據分析優化
Agent K v1.0 是華為諾亞方舟實驗室與倫敦大學學院團隊聯合推出的端到端自主數據科學智能體,能自動化、優化和泛化處理多種數據科學任務。Agent K v1.0基于結...
Pixtral Large:Mistral AI推出的超大多模態模型實現先進的文本與視覺理解能力
Pixtral Large是法國Mistral AI開源的1240億參數超大多模態模型,具備前沿級圖像理解能力,支持128K上下文,能理解文本、圖表和圖像。Pixtral Large基于Mistr...