AI項目和框架
Multi-Speaker
Multi-Speaker是AudioShake推出的全球首個高分辨率多說話人分離模型。支持將音頻中的多個說話人精準分離到不同軌道,解決傳統音頻工具在處理重疊語音時的難題...
Stable Virtual Camera
Stable Virtual Camera 是 Stability AI 推出的 AI 模型,能將 2D 圖像轉換為具有真實深度和透視感的 3D 視頻。用戶可以通過指定相機軌跡和多種動態路徑(如...
SmolDocling
SmolDocling(SmolDocling-256M-preview )是高效輕量級的多模態文檔處理模型。能將文檔圖像端到端地轉換為結構化文本,支持文本、公式、圖表等多種元素識別...
Claude 3.7 Max
Claude 3.7 Max 是 Cursor 推出的專為復雜代碼任務設計的最新 AI 模型,稱為史上最強代碼助手。基于 Claude 3.7 思考模型,具備 200k 超大上下文窗口,支持處...
Skywork R1V
Skywork R1V是昆侖萬維開源的首款工業界多模態思維鏈推理模型,具備強大的視覺鏈式推理能力。Skywork R1V能對視覺輸入進行多步邏輯推理,解決復雜的視覺任務...
OpenBioMed
OpenBioMed 是清華大學智能產業研究院(AIR)和水木分子共同推出的開源平臺,專注于 AI 驅動的生物醫學研究。是多模態表征學習工具包,能處理分子、蛋白質、...
粵公網安備 44011502001135號