AI工具

在哪兒問問

在哪兒問問是滴滴推出的AI圖尋小程序,用戶可通過上傳照片,讓AI識別照片中的地點,獲取其大致位置。提供地點查找功能,能推薦相似地點及照片中的相關產品,...
閱讀原文

xLLM

xLLM 是京東開源的高效智能推理框架,專為國產芯片優化,支持端云一體部署。框架用服務-引擎分離架構,服務層負責請求調度與容錯,引擎層專注運算優化,具備...
閱讀原文

SciToolAgent

SciToolAgent是浙江大學創新中心(HICAI-ZJU)開發的開源工具平臺,提升科研效率。整合了500多種科學工具,覆蓋生物學、化學、材料科學等多領域,可處理數據...
閱讀原文

Mano

Mano 是明略科技推出的專有大模型,專注于圖形用戶界面(GUI)智能操作。模型基于多模態基礎模型,通過在線強化學習和訓練數據自動采集等創新技術,在 Mind2W...
閱讀原文

Tinker API

Tinker API 是 Thinking Machines Lab 發布的首款產品,專為語言模型微調而設計。簡化語言模型的微調流程,讓研究人員和開發者能專注于算法和數據,無需擔心...
閱讀原文

LONGLIVE

LONGLIVE 是英偉達等頂尖機構聯合推出的實時交互式長視頻生成框架。框架通過幀級自回歸(AR)模型,結合 KV-recache 機制、流式長視頻微調和短窗口注意力 + ...
閱讀原文

Dreamer 4

Dreamer 4 是由 DeepMind 開發的新型智能體,通過在快速且準確的世界模型中進行想象訓練來解決復雜的控制任務。在《我的世界》(Minecraft)游戲中,Dreamer ...
閱讀原文

Logics-Parsing

Logics-Parsing 是阿里巴巴開源的端到端文檔解析模型,基于 Qwen2.5-VL-7B。通過強化學習優化文檔布局分析和閱讀順序推斷,能將 PDF 圖像轉換為結構化 HTML ...
閱讀原文

聆音EchoCare

聆音(EchoCare)是中國科學院香港創新研究院人工智能與機器人創新中心(CAIR)推出的超聲大模型。模型依托450萬張超聲影像數據集EchoAtlas進行訓練,數據集...
閱讀原文

RoboBrain-X0

RoboBrain-X0是北京智源人工智能研究院開源的全球首個支持零樣本跨本體泛化的具身模型。能在無需微調的情況下,驅動多種不同構造的真實機器人完成基礎操作任...
閱讀原文

Ring-1T-preview

Ring-1T-preview 是螞蟻集團開源的萬億參數大模型預覽版,基于 Ling 2.0 MoE 架構,在 20T 語料上預訓練,通過自研強化學習系統 ASystem 進行推理能力訓練。...
閱讀原文

GLM-4.6

GLM-4.6 是智譜推出的新一代基座大模型,總參數量達 355B,激活參數 32B。模型在真實編程、長上下文處理、推理能力、信息搜索、寫作能力及智能體應用等方面實...
閱讀原文

豆包大模型1.6-vision

豆包大模型1.6-vision是火山引擎推出的具備工具調用能力的視覺深度思考模型。模型擁有強大的通用多模態理解和推理能力,支持Responses API,能自主調用工具如...
閱讀原文

OpenPPT

OpenPPT 是開源的PPT工具,核心服務基于ChatPPT能提供高效、便捷的 PPT 制作體驗。工具支持多平臺使用,包括 Windows、macOS 和 Linux,讓用戶能在不同設備上...
閱讀原文

Claude Sonnet 4.5

Claude Sonnet 4.5 是 Anthropic 最新推出的最強編程模型。模型在編程、計算機操作、推理和數學等多個領域表現出色,在 SWE-bench Verified 測試中登頂,能專...
閱讀原文
189101112282