Phi-4-Multimodal
Phi-4-Multimodal 是微軟最新推出的多模態語言模型,擁有 56 億參數,能將語音、視覺和文本處理集成到一個統一架構中。模型在多個基準測試中表現優異,在自動...
R1-Onevision
R1-Onevision 是開源的多模態大語言模型,專注于復雜視覺推理任務。基于 Qwen2.5-VL 微調而成,通過整合視覺和文本數據,能精準地進行多模態信息解釋。在數學...
Phi-4-Mini
Phi-4-Mini 是微軟 Phi-4 系列中最新推出的專注于文本任務的小型語言模型,參數量為 38 億。基于密集的解碼器-only Transformer 架構,結合分組查詢注意力(G...
All Voice Lab
All Voice Lab(趣丸千音)是全球領先的AI語音創作平臺,提供一站式智能語音解決方案,基于趣丸科技與香港中文大學(深圳)聯合研發的MaskGCT語音大模型開發...
VideoGrain
VideoGrain 是悉尼科技大學和浙江大學推出的零樣本多粒度視頻編輯框架,能實現類別級、實例級和部件級的精細視頻修改。VideoGrain基于調節時空交叉注意力和自...
Zapier Agents
Zapier Agents 是 Zapier 推出的 AI 自動化工具,通過人工智能技術幫助用戶高效處理各種任務。能與 Zapier 支持的 7000 多個應用程序無縫集成,例如 Salesfor...
騰訊混元Turbo S
騰訊混元Turbo S是騰訊推出的新一代快思考模型。模型采用創新的Hybrid-Mamba-Transformer融合架構,有效降低了傳統Transformer的計算復雜度,減少了KV-Cache...