AI工具
WhisperLiveKit
WhisperLiveKit 是開源的實時語音識別工具,能將語音實時轉錄為文字,支持說話人識別。工具基于先進的技術如 SimulStreaming 和 WhisperStreaming,提供超低...
XBai o4
XBai o4是開源的大語言模型,基于“反射生成形式”訓練,結合長CoT強化學習和過程獎勵學習,在復雜推理能力上表現出色,中等模式下已超越OpenAI-o3-mini。
EchoMimicV3
EchoMimicV3是螞蟻集團推出的高效多模態、多任務數字人視頻生成框架。框架擁有13億參數,基于任務混合和模態混合范式,結合新穎的訓練與推理策略,實現快速、...
SpatialGen
SpatialGen 是群核科技開源的 3D 場景生成模型。模型基于擴散模型架構,支持根據文字描述、參考圖像和 3D 空間布局,生成時空一致的多視角圖像,且能進一步得...
內容特工隊ReelsAgent
內容特工隊ReelsAgent是全球首個移動端AI營銷視頻智能體Agent。實現了從市場調研、創意生成到視頻發布全流程自動化,用戶只需輸入需求,可生成適配多平臺的專...
DeepSeek V3.1
DeepSeek V3.1是DeepSeek最新推出的AI模型版本,具備混合推理架構,能自由切換思考模式與非思考模式,思考效率顯著提升。模型在V3的基礎上進行多項升級,上下...
SlowFast-LLaVA-1.5
SlowFast-LLaVA-1.5(簡稱SF-LLaVA-1.5)是專為長視頻理解設計的高效視頻大語言模型。基于雙流(SlowFast)機制,平衡處理更多輸入幀與減少每幀令牌數量之間...
CourseCorrect
CourseCorrect 是幫助用戶提升技能的智能學習平臺。用戶只需輸入想學習的主題,平臺能快速從互聯網上篩選出排名前20的優質課程。與傳統課程評價不同,CourseC...