標簽:自然語言處理

Uthana

Uthana 是專注于3D角色動畫生成的AI平臺。平臺基于簡單的文字描述、參考視頻或動作庫搜索,快速為用戶生成逼真的動畫,支持適配任何骨骼結構的模型。Uthana ...
閱讀原文

OLMo 2 32B

OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新開源語言模型,是 OLMo 2 系列的重要成果。擁有 320 億參數,是首個在多技能學術基準測試中超越 GPT-...
閱讀原文

Claude 3.7 Max

Claude 3.7 Max 是 Cursor 推出的專為復雜代碼任務設計的最新 AI 模型,稱為史上最強代碼助手。基于 Claude 3.7 思考模型,具備 200k 超大上下文窗口,支持處...
閱讀原文

Chirp 3

Chirp 3 是谷歌云推出的高清語音合成模型,專為生成自然、生動的語音而設計。支持 248 種聲音和 31 種語言,能捕捉人類語調的細微差別,語音輸出更加貼近真實...
閱讀原文

Mistral Small 3.1

Mistral Small 3.1 是 Mistral AI 開源的多模態人工智能模型,有 240 億參數,基于 Apache 2.0 許可證發布。在文本和多模態任務上表現出色,支持長達 128k to...
閱讀原文

Same.dev

Same.dev 是 AI 前端開發工具,專注于將網頁截圖、設計文件或網頁鏈接轉化為前端代碼。以像素級精度復制用戶界面,確保生成的代碼與原始設計高度一致。用戶只...
閱讀原文

文心大模型X1

文心大模型X1是百度推出的深度思考模型。具備“長思維鏈”,擅長中文知識問答、文學創作、邏輯推理等。X1增加了多模態能力,能理解和生成圖片,能調用工具生成...
閱讀原文

Chitu

Chitu(赤兔)是清華大學高性能計算研究所與清程極智聯合開源的高性能大模型推理引擎,專為解決大模型在推理階段的高成本和低效率問題設計,具有強大的硬件適...
閱讀原文

APB

APB(Accelerating Distributed Long-Context Inference by Passing Compressed Context Blocks across GPUs)是清華大學等機構聯合提出的分布式長上下文推理...
閱讀原文

Gemini 2.0 Flash

Gemini 2.0 Flash是Google推出的多模態AI模型,結合文本理解和圖像生成能力。根據自然語言輸入生成高質量的圖像,支持多輪對話式的圖像編輯,保持上下文連貫...
閱讀原文

Open-Sora 2.0

Open-Sora 2.0 是潞晨科技推出的全新開源SOTA(State-of-the-Art)視頻生成模型。Open-Sora 2.0 用 20 萬美元(224 張 GPU)成功訓練出 11B 參數的商業級模型...
閱讀原文

謎境

謎境是國內首款AI創作Agent的互動劇本平臺,專注于互動小說和劇本創作。平臺搭載DeepSeek R1的推理思考能力,實現從劇本大綱、人物設定、角色關系圖、分鏡腳...
閱讀原文

飛算JavaAI

飛算JavaAI是飛算科技推出的智能Java開發助手。通過自然語言輸入,實現從需求分析到代碼生成的全流程智能化開發。核心功能包括需求分析、軟件設計、代碼生成...
閱讀原文

Deep Research Web UI

Deep Research Web UI 是開源的 AI 研究助手工具,幫助用戶高效地進行深度研究。通過 AI 驅動的迭代搜索,逐步深入挖掘指定主題,以樹狀結構可視化研究過程,...
閱讀原文

VACE

VACE(Video Creation and Editing)是阿里巴巴通義實驗室推出的一站式視頻生成與編輯框架。基于整合多種視頻任務(如參考視頻生成、視頻到視頻編輯、遮罩編...
閱讀原文
1121314151667