AI項目和框架

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一個“思考模型”,能在回應前進行推理,提升性能和準確性。模型在多個基準測試中表現卓越,在推理和代碼生成方面...
閱讀原文

ReasonGraph

ReasonGraph 是用在可視化和分析大語言模型(LLMs)推理過程的開源網絡平臺。ReasonGraph支持超過 50 種主流模型(如 Anthropic、OpenAI、Google 等),涵蓋...
閱讀原文

AndroidGen

AndroidGen 是智譜技術團隊推出增強基于大語言模型(LLM)的 Agent 能力的框架,特別是在數據稀缺的情況下。框架通過收集人類任務軌跡基于這些軌跡訓練語言模...
閱讀原文

Qwen2.5-VL-32B

Qwen2.5-VL-32B是阿里巴巴開源的多模態模型,參數規模為32B。模型在Qwen2.5-VL系列的基礎上,基于強化學習優化,具備更符合人類偏好的回答風格、顯著提升的數...
閱讀原文

瀚海智語

瀚海智語(OceanDS)是國家海洋環境預報中心聯合海洋出版社和三六零數字安全科技共同推出的國內首個海洋垂直領域大語言模型,模型以360智腦13B和Deepseek-R1-...
閱讀原文

LHM

LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通義實驗室推出的從單張圖像重建可動畫化3D人體模型。基于多模態Transformer架構,融合3D幾何...

龍貓LongCat

LongCat(龍貓)是美團自主研發的生成式AI大模型,通過人工智能技術提升公司內部工作效率和創新能力。模型具備強大的多模態能力,能處理文本、圖像等多種數據...
閱讀原文

MoshiVis

MoshiVis 是 Kyutai 推出的開源多模態語音模型,基于 Moshi 實時對話語音模型開發,增加了視覺輸入功能。能實現圖像的自然、實時語音交互,將語音和視覺信息...

DeepMesh

DeepMesh 是清華大學和南洋理工大學研究人員提出的 3D 網格生成框架,基于強化學習和自回歸變換器生成高質量的 3D 網格。通過兩項關鍵創新來優化網格生成:一...
閱讀原文

BlockDance

BlockDance 是復旦大學聯合字節跳動智能創作團隊推出的用在加速擴散模型的新方法。BlockDance 基于識別重用相鄰時間步中結構相似的時空特征(STSS),減少冗...
閱讀原文

Reve Image

Reve Image 是 Reve 推出的全新 AI 圖像生成模型。專注于提升美學表現、精確的提示遵循能力以及出色的排版設計,能生成高質量的視覺作品。模型在生成圖像時展...
閱讀原文

RuoYi AI

RuoYi AI 是全棧式 AI 開發平臺,提供完整的前端、后臺管理及小程序應用,支持靈活修改和分發代碼。RuoYi AI 支持本地 RAG 方案,集成 Milvus/Weaviate 等向...
閱讀原文

食神

食神是老板電器推出的首個烹飪垂直領域大模型。基于老板電器46年積累的海量烹飪數據,結合DeepSeek技術,能精準理解烹飪場景需求。用戶可通過語音、文字等方...
閱讀原文

Soundwave

Soundwave是香港中文大學(深圳)開源的語音理解大模型,專注于語音與文本的智能對齊和理解。通過創新的對齊適配器和壓縮適配器技術,有效解決了語音和文本在...
閱讀原文

Motia

Motia 是專為軟件工程師設計的 AI Agent 框架,簡化 AI 智能體的開發、測試和部署過程。支持多種編程語言,如 Python、TypeScript 和 Ruby,開發者可以使用熟...
閱讀原文
15657585960155