AI項目和框架
OpenVision
OpenVision是加州大學圣克魯茲分校(UCSC)推出的完全開放、高效且靈活的高級視覺編碼器家族,專注于多模態學習。提供從5.9M到632.1M參數的多種規模模型,適...
AgentCPM-GUI
AgentCPM-GUI 是清華大學和面壁智能團隊聯合推出的開源端側 GUI Agent ,針對中文應用優化。模型基于 MiniCPM-V(80 億參數)構建,能接受智能手機截圖作為輸...
StreamBridge
StreamBridge 是蘋果公司與復旦大學聯合推出的端側視頻大語言模型(Video-LLMs)框架,能幫助 AI 實時理解直播流視頻。框架基于內存緩沖區和輪次衰減壓縮策略...
Seedance 1.0 lite
Seedance 1.0 lite是火山引擎推出的豆包視頻生成模型的小參數量版本,支持文生視頻和圖生視頻兩種生成方式,支持生成5秒或10秒、480p或720p分辨率的視頻。
HealthBench
HealthBench是OpenAI推出的醫療開源測試基準,用在評估大型語言模型(LLMs)在醫療保健領域的表現和安全性。HealthBench包含5000個模型與用戶或醫療專業人員...
Chinese-LiPS
Chinese-LiPS 是智源研究院聯合南開大學共同打造的高質量中文多模態語音識別數據集,包含100小時的語音、視頻和手動轉錄文本,創新性地融合了唇讀視頻和演講...