Gemini Embedding
Gemini Embedding 是 Google 推出的先進的文本嵌入模型,基于將文本轉化為高維數值向量,捕捉其語義和上下文信息。Gemini Embedding基于 Gemini 模型訓練,具...
Character-3
Character-3 是 Hedra Studio 推出的全模態 AI 數字人視頻生成模型,能同時處理圖像、文本和音頻輸入,通過聯合推理生成高質量的視頻。支持全身動作捕捉和情...
Nanobrowser
Nanobrowser 是開源的 Chrome 擴展工具,專注于 AI 驅動的網頁自動化。Nanobrowser基于多智能體系統實現復雜的網頁任務,如信息提取、自動化操作等。用戶用自...
DINO-XSeek
DINO-XSeek 是 IDEA 研究院推出的多模態目標檢測模型,結合視覺感知和自然語言理解能力。DINO-XSeek基于復雜的語言描述精準定位圖像中的目標,識別目標的屬性...
URO-Bench
URO-Bench 是面向端到端語音對話模型(SDMs)的全面基準測試工具。涵蓋了多語言、多輪對話、副語言信息等多維度任務,全面評估語音對話模型的性能。