AI項目和框架

Mistral Small 3.1

Mistral Small 3.1 是 Mistral AI 開源的多模態人工智能模型,有 240 億參數,基于 Apache 2.0 許可證發布。在文本和多模態任務上表現出色,支持長達 128k to...
閱讀原文

MedRAG

MedRAG是南洋理工大學研究團隊提出的醫學診斷模型,通過結合知識圖譜推理增強大語言模型(LLM)的診斷能力。模型構建了四層細粒度診斷知識圖譜,可精準分類不...
閱讀原文

MM-Eureka

MM-Eureka 是上海人工智能實驗室、上海創智學院、上海交通大學和香港大學的研究人員共同開發的多模態推理模型。模型通過基于規則的大規模強化學習(RL),將...
閱讀原文

Command A

Command A 是 Cohere 推出的最新生成式 AI 模型,專為企業級應用設計。Command A用高性能和低硬件成本為核心優勢,能在兩塊 GPU 上高效部署,相比其他類似模...
閱讀原文

AudioX

AudioX 是香港科技大學和月之暗面聯合提出的統一擴散變壓器模型,專門用于從任意內容生成音頻和音樂。模型能處理多種輸入模態,包括文本、視頻、圖像、音樂和...
閱讀原文

文心大模型4.5

文心大模型4.5是百度正式發布的最新一代首個原生多模態大模型,在多模態理解、文本和邏輯推理等方面有顯著提升,多項測試表現優于GPT4.5。模型已上線百度智能...
閱讀原文

文心大模型X1

文心大模型X1是百度推出的深度思考模型。具備“長思維鏈”,擅長中文知識問答、文學創作、邏輯推理等。X1增加了多模態能力,能理解和生成圖片,能調用工具生成...
閱讀原文

Chitu

Chitu(赤兔)是清華大學高性能計算研究所與清程極智聯合開源的高性能大模型推理引擎,專為解決大模型在推理階段的高成本和低效率問題設計,具有強大的硬件適...
閱讀原文

MetaStone-L1-7B

MetaStone-L1-7B 是 MetaStone 系列中的輕量級推理模型,專為提升復雜下游任務的性能而設計。在數學和代碼等核心推理基準測試中達到了并行模型的頂尖水平(SO...
閱讀原文

MT-TransformerEngine

MT-TransformerEngine 是摩爾線程開源的高效訓練與推理優化框架,專為 Transformer 模型設計。框架通過算子融合、并行加速等技術,充分基于摩爾線程全功能 GP...
閱讀原文

APB

APB(Accelerating Distributed Long-Context Inference by Passing Compressed Context Blocks across GPUs)是清華大學等機構聯合提出的分布式長上下文推理...
閱讀原文

Botgroup.chat

Botgroup.chat 是基于 React 和 Cloudflare Pages 的多人 AI 聊天應用。支持多個 AI 角色同時參與對話,提供類似群聊的交互體驗。用戶可以自定義 AI 角色的性...
閱讀原文

MT-MegatronLM

MT-MegatronLM 是摩爾線程推出的面向全功能 GPU 的開源混合并行訓練框架,主要用于高效訓練大規模語言模型。支持 dense 模型、多模態模型及 MoE(混合專家)...
閱讀原文

Gemini 2.0 Flash

Gemini 2.0 Flash是Google推出的多模態AI模型,結合文本理解和圖像生成能力。根據自然語言輸入生成高質量的圖像,支持多輪對話式的圖像編輯,保持上下文連貫...
閱讀原文

TokenSwift

TokenSwift 是北京通用人工智能研究院團隊推出的超長文本生成加速框架,能在90分鐘內生成10萬Token的文本,相比傳統自回歸模型的近5小時,速度提升了3倍,生...
閱讀原文
15960616263155