標簽:多語言支持

Mistral OCR

Mistral OCR 是 Mistral AI 推出的先進光學字符識別(OCR)工具,專為處理復雜文檔而設計。能全面理解文檔中的文本、圖像、表格和數學公式等元素,支持數千種...
閱讀原文

SuperGPQA

SuperGPQA 是字節跳動豆包大模型團隊聯合 M-A-P 推出的全面覆蓋 285 個研究生級學科、包含 26529 道專業題目的知識推理基準測試集。解決傳統評測基準學科覆蓋...
閱讀原文

NextGenAI

NextGenAI是OpenAI推出的全球性聯盟,基于AI技術推動教育和研究的進步。NextGenAI聯合包括哈佛大學、麻省理工學院、牛津大學等在內的15所頂尖大學和機構,Ope...
閱讀原文

NotaGen

NotaGen 是中央音樂學院、北京航空航天大學、清華大學等機構推出的音樂生成模型,基于模仿大型語言模型(LLM)的訓練范式生成高質量的古典樂譜。NotaGen 基于...
閱讀原文

Platus

Platus 是法律科技初創公司,專注于通過人工智能和無代碼平臺簡化企業的法律流程。為中小企業和法律團隊提供高效、自動化的法律基礎設施,支持文件起草、審查...
閱讀原文

Liquid

Liquid是華中科技大學、字節跳動和香港大學聯合推出的極簡統一多模態生成框架。基于VQGAN將圖像編碼為離散的視覺token,與文本token共享同一詞匯空間,讓大型...
閱讀原文

Promptimize AI

Promptimize AI 是專注于優化 AI 提示詞的工具,幫助用戶通過更精準的提示詞提升 AI 輸出的質量和效率。以瀏覽器插件的形式,支持多種主流 AI 平臺,如 ChatG...
閱讀原文

AVD2

AVD2(Accident Video Diffusion for Accident Video Description)是清華大學聯合香港科技大學、吉林大學、南京理工大學、北京理工大學、復旦大學等機構推出...
閱讀原文

Manus

Manus 是Monica團隊推出的全球首款通用型 AI Agent。Manus能獨立思考、規劃和執行復雜任務,直接交付完整成果。與傳統 AI 不同,Manus 擁有強大的工具調用能...
閱讀原文

BGE-VL

BGE-VL 是北京智源研究院聯合多所高校推出的多模態向量模型,基于大規模合成數據 MegaPairs 訓練而成。BGE-VL專注于多模態檢索任務,如圖文檢索和組合圖像檢...
閱讀原文

Image-01

Image-01 是 MiniMax 推出的先進文本到圖像生成模型,具備卓越的圖像生成能力。能將用戶輸入的文本描述精準轉化為高質量圖像,支持多種縱橫比和高分辨率輸出...
閱讀原文

PRefLexOR

PRefLexOR(Preference-based Recursive Language Modeling for Exploratory Optimization of Reasoning)是MIT團隊提出的新型自學習AI框架,結合了偏好優化...
閱讀原文

MindLLM

MindLLM 是耶魯大學、達特茅斯學院和劍橋大學聯合推出的AI模型,能將腦部功能性磁共振成像(fMRI)信號解碼為自然語言文本。MindLLM基于一個主體無關(subjec...
閱讀原文

AgiBot Digital World

AgiBot Digital World 是智元機器人推出的高保真機器人仿真框架,為機器人操作技能研究與應用提供高效支持。AgiBot Digital World集成海量逼真的三維資產、多...
閱讀原文

Spark-TTS

Spark-TTS 是SparkAudio 團隊開源的基于大型語言模型(LLM)的高效文本轉語音(TTS)工具, 無需額外的生成模型,直接從 LLM 預測的編碼中重建音頻,實現零樣...
閱讀原文
1131415161761