標簽:自然語言處理

Aqua Voice

Aqua Voice 是AI語音驅動的文檔編輯工具。Aqua Voice支持將語音轉換為文本,且支持用自然語言指令對文本進行編輯和格式化,如刪除、重述、格式調整等。Aqua V...
閱讀原文

豆包1.5·UI-TARS

豆包1.5·UI-TARS是字節豆包推出的面向圖形界面交互(GUI)的Agent模型。模型基于感知、推理和動作執行等類人能力,與圖形界面進行連續、流暢的交互。模型將視...
閱讀原文

Trae 插件

Trae 插件是 Trae 旗下新一代 AI 編程助手(原 MarsCode 編程助手),以插件形態集成在本地 IDE 之中,兼容性強、使用靈活。提升開發效率和代碼質量。支持100...
閱讀原文

OpenAI o4-mini

OpenAI o4-mini 是OpenAI推出的小型推理模型,專為快速、經濟高效的推理而優化。OpenAI o4-mini 在數學、編程和視覺任務方面表現出色,是 AIME 2024 和 2025 ...
閱讀原文

Kimina-Prover

Kimina-Prover是月之暗面與Numina團隊合作推出的大型數學定理證明模型,模型采用大規模強化學習訓練,能以類似人類的方式進行推理,在Lean 4語言中嚴謹地證明...
閱讀原文

破殼AI口語

破殼AI口語是AI英語口語學習應用,基于AI技術為用戶提供個性化口語練習體驗。破殼AI口語涵蓋生活、校園、旅游、職場等多場景對話,幫助用戶提升流利度、語法...
閱讀原文

GLM-Z1-32B

GLM-Z1-32B是智譜公司開源的新一代推理模型,具體參數版本為GLM-Z1-32B-0414 。GLM-Z1-32B基于 GLM-4-32B-0414 基座模型開發,基于深度優化訓練,在數學、代...
閱讀原文

可靈2.0

可靈2.0是快手推出的新一代 AI 視頻生成模型,現已上線可靈AI視頻平臺。平臺更新包含可靈2.0(大師版)和可圖2.0兩大基礎模型??蓤D2.0大幅提升圖片生成質量...
閱讀原文

Agent Development Kit

Agent Development Kit(ADK)是谷歌開源的首個AI智能體開發工具包,是一個代碼優先的Python工具包,簡化復雜AI代理的構建、評估和部署過程。ADK支持多智能體...
閱讀原文

Skywork-OR1

Skywork-OR1(Open Reasoner 1)是昆侖萬維推出的開源高性能推理模型系列,模型突破大模型在邏輯推理和復雜任務求解方面的能力瓶頸。Skywork-OR1包含三款模型,...
閱讀原文

UNO

UNO是字節跳動推出創新的AI圖像生成框架,突破傳統模型在多主體生成中的局限。通過“少到多”的泛化方法,能高質量地生成單主體和多主體圖像,解決了多主體場景...
閱讀原文

Pika Twists

Pika Twists 是 Pika Labs 推出的 AI 視頻編輯功能,能讓用戶輕松修改視頻中的主體動作和場景,創造出奇幻效果。只需上傳視頻并描述需求,AI 可精準操控角色...
閱讀原文

Multi-SWE-bench

Multi-SWE-bench 是字節跳動豆包大模型團隊開源的首個多語言代碼修復基準。在SWE-bench基礎上,首次覆蓋Python之外的7種主流編程語言,包括Java、TypeScript...
閱讀原文

Gemini 2.5 Flash

Gemini 2.5 Flash 是 Google 推出的高效、低延遲的 AI 模型,基于 Gemini 2.5 模型構建。Gemini 2.5 Flash在保持低延遲和成本效益的同時,引入思考能力。
閱讀原文

A2A

A2A(Agent2Agent)是谷歌開源的首個標準智能體交互協議,讓不同框架和供應商構建的AI智能體相互協作。A2A基于標準化的通信方式,打破系統孤島,讓智能體安全...
閱讀原文
13456762