OpenVision
OpenVision是加州大學圣克魯茲分校(UCSC)推出的完全開放、高效且靈活的高級視覺編碼器家族,專注于多模態學習。提供從5.9M到632.1M參數的多種規模模型,適...
AgentCPM-GUI
AgentCPM-GUI 是清華大學和面壁智能團隊聯合推出的開源端側 GUI Agent ,針對中文應用優化。模型基于 MiniCPM-V(80 億參數)構建,能接受智能手機截圖作為輸...
StreamBridge
StreamBridge 是蘋果公司與復旦大學聯合推出的端側視頻大語言模型(Video-LLMs)框架,能幫助 AI 實時理解直播流視頻。框架基于內存緩沖區和輪次衰減壓縮策略...
Addsubtitle
Addsubtitle 是基于 AI 的在線視頻編輯工具,通過智能技術為用戶提供便捷的字幕添加、翻譯及視頻編輯服務。用戶可以輕松將視頻翻譯成100多種語言,一鍵添加多...