AI工具

WhisperLiveKit

WhisperLiveKit 是開源的實時語音識別工具,能將語音實時轉錄為文字,支持說話人識別。工具基于先進的技術如 SimulStreaming 和 WhisperStreaming,提供超低...
閱讀原文

VibePPT

VibePPT 是 AI 演示文稿制作工具,通過對話式交互,讓用戶能快速生成具有專業設計感的演示文稿。用戶只需輸入主題或內容,VibePPT能智能生成幻燈片,提供多種...
閱讀原文

XBai o4

XBai o4是開源的大語言模型,基于“反射生成形式”訓練,結合長CoT強化學習和過程獎勵學習,在復雜推理能力上表現出色,中等模式下已超越OpenAI-o3-mini。

VibeVoice

VibeVoice 是微軟推出的新型文本到語音(TTS)模型,能生成富有表現力、長篇幅、多說話者的對話式音頻,如播客。
閱讀原文

EchoMimicV3

EchoMimicV3是螞蟻集團推出的高效多模態、多任務數字人視頻生成框架。框架擁有13億參數,基于任務混合和模態混合范式,結合新穎的訓練與推理策略,實現快速、...
閱讀原文

SpatialGen

SpatialGen 是群核科技開源的 3D 場景生成模型。模型基于擴散模型架構,支持根據文字描述、參考圖像和 3D 空間布局,生成時空一致的多視角圖像,且能進一步得...
閱讀原文

內容特工隊ReelsAgent

內容特工隊ReelsAgent是全球首個移動端AI營銷視頻智能體Agent。實現了從市場調研、創意生成到視頻發布全流程自動化,用戶只需輸入需求,可生成適配多平臺的專...
閱讀原文

問小白o4

問小白o4是國內首個并行思考模型,能同時啟動8條思考路徑,自動篩選最優解,提供精準答案。模型融合Long?CoT強化學習與過程獎勵學習,具備深度推理和高質量思...
閱讀原文

FutureX

FutureX是字節跳動、復旦大學、斯坦福大學和普林斯頓大學的研究團隊聯合發布的,專為LLM智能體未來預測任務設計的動態實時評估基準。通過半自動化管道從195個...
閱讀原文

DeepSeek V3.1

DeepSeek V3.1是DeepSeek最新推出的AI模型版本,具備混合推理架構,能自由切換思考模式與非思考模式,思考效率顯著提升。模型在V3的基礎上進行多項升級,上下...
閱讀原文

SlowFast-LLaVA-1.5

SlowFast-LLaVA-1.5(簡稱SF-LLaVA-1.5)是專為長視頻理解設計的高效視頻大語言模型。基于雙流(SlowFast)機制,平衡處理更多輸入幀與減少每幀令牌數量之間...
閱讀原文

CourseCorrect

CourseCorrect 是幫助用戶提升技能的智能學習平臺。用戶只需輸入想學習的主題,平臺能快速從互聯網上篩選出排名前20的優質課程。與傳統課程評價不同,CourseC...
閱讀原文

Snowglobe

Snowglobe 是 Guardrails AI 推出的 AI 代理和聊天機器人模擬測試工具。通過模擬真實用戶行為,快速生成大量對話數據,幫助開發者在部署前發現潛在問題。Snow...
閱讀原文

ComoRAG

ComoRAG 是華南理工大學未來技術學院、微信 AI 團隊等機構聯合推出的認知啟發式檢索增強生成(RAG)框架,專門用在長篇敘事文本的理解和推理。
閱讀原文

Anything

Anything 是創新的 AI 應用構建平臺,通過與 AI 的對話式交互,幫助用戶快速創建強大的應用程序和網站。用戶只需通過聊天的方式表達自己的想法和需求,AI 能...
閱讀原文
167891020,741