AI項目和框架

SmolDocling

SmolDocling(SmolDocling-256M-preview )是高效輕量級的多模態文檔處理模型。能將文檔圖像端到端地轉換為結構化文本,支持文本、公式、圖表等多種元素識別...
閱讀原文

GR00T N1

GR00T N1 是英偉達推出的全球首個開源基礎模型,專為通用人形機器人設計。基于多模態輸入(如語言和圖像)實現多樣化環境中的操作任務。GR00T N1 基于大規模...
閱讀原文

LangManus

LangManus 是 AI 自動化框架,基于分層多智能體系統設計。包含多種智能體,如協調員、規劃員、研究員、程序員等,各司其職,協同完成復雜任務。框架支持多種...
閱讀原文

Claude 3.7 Max

Claude 3.7 Max 是 Cursor 推出的專為復雜代碼任務設計的最新 AI 模型,稱為史上最強代碼助手。基于 Claude 3.7 思考模型,具備 200k 超大上下文窗口,支持處...
閱讀原文

Skywork R1V

Skywork R1V是昆侖萬維開源的首款工業界多模態思維鏈推理模型,具備強大的視覺鏈式推理能力。Skywork R1V能對視覺輸入進行多步邏輯推理,解決復雜的視覺任務...
閱讀原文

Chirp 3

Chirp 3 是谷歌云推出的高清語音合成模型,專為生成自然、生動的語音而設計。支持 248 種聲音和 31 種語言,能捕捉人類語調的細微差別,語音輸出更加貼近真實...
閱讀原文

I2V3D

I2V3D是香港城市大學和微軟 GenAI創新的圖像到視頻生成框架,支持將靜態圖像轉換為動態視頻,基于3D幾何引導實現精確的動畫控制。I2V3D結合傳統計算機圖形學...
閱讀原文

OpenBioMed

OpenBioMed 是清華大學智能產業研究院(AIR)和水木分子共同推出的開源平臺,專注于 AI 驅動的生物醫學研究。是多模態表征學習工具包,能處理分子、蛋白質、...
閱讀原文

amis

amis 是百度開源的低代碼前端框架,基于簡單的 JSON 配置快速生成各種后臺頁面,無需編寫復雜前端代碼。amis支持表單、表格、圖表、CRUD 操作等功能,提供豐...
閱讀原文

Mistral Small 3.1

Mistral Small 3.1 是 Mistral AI 開源的多模態人工智能模型,有 240 億參數,基于 Apache 2.0 許可證發布。在文本和多模態任務上表現出色,支持長達 128k to...
閱讀原文

MedRAG

MedRAG是南洋理工大學研究團隊提出的醫學診斷模型,通過結合知識圖譜推理增強大語言模型(LLM)的診斷能力。模型構建了四層細粒度診斷知識圖譜,可精準分類不...
閱讀原文

MM-Eureka

MM-Eureka 是上海人工智能實驗室、上海創智學院、上海交通大學和香港大學的研究人員共同開發的多模態推理模型。模型通過基于規則的大規模強化學習(RL),將...
閱讀原文

Command A

Command A 是 Cohere 推出的最新生成式 AI 模型,專為企業級應用設計。Command A用高性能和低硬件成本為核心優勢,能在兩塊 GPU 上高效部署,相比其他類似模...
閱讀原文

AudioX

AudioX 是香港科技大學和月之暗面聯合提出的統一擴散變壓器模型,專門用于從任意內容生成音頻和音樂。模型能處理多種輸入模態,包括文本、視頻、圖像、音樂和...
閱讀原文

文心大模型4.5

文心大模型4.5是百度正式發布的最新一代首個原生多模態大模型,在多模態理解、文本和邏輯推理等方面有顯著提升,多項測試表現優于GPT4.5。模型已上線百度智能...
閱讀原文
14950515253146