AI項目和框架
LongReward
LongReward是清華大學、中國科學院、智譜AI聯合推出的,基于AI反饋改進長文本大型語言模型(LLMs)性能的方法。LongReward從有用性、邏輯性、忠實性和完整性...
Fish Agent
Fish Agent是FishAudio推出的創新的端到端語音處理模型,集成自動語音識別(ASR)和文本到語音(TTS)技術,無需傳統的語義編碼器/解碼器,即可實現語音到語...
MeetingMind
MeetingMind是AI驅動的會議助手,基于錄音和文件上傳功能自動轉錄會議音頻,從中提取關鍵信息,如任務、決策和問題,幫助用戶輕松捕獲和分析會議內容,采取行...
Fast GraphRAG
Fast GraphRAG 是微軟推出的高效的知識圖譜檢索框架,旨在提供可解釋性和高精度的代理驅動檢索工作流。它結合了檢索增強生成(RAG)技術和知識圖譜,提升大型...
ComfyUI-MochiEdit
ComfyUI-MochiEdit是基于ComfyUI和Genmo Mochi的開源視頻編輯工具,基于將視頻轉換為噪聲、重新采樣實現視頻編輯,支持局部編輯和視頻轉視頻功能。用戶能調整...
Ferret-UI 2
Ferret-UI 2是蘋果公司推出的多模態大型語言模型,用在理解和交互移動用戶界面。Ferret-UI 2能識別和理解各種移動設備屏幕上的UI元素,執行復雜的用戶指令,...
MMBench-Video
MMBench-Video是新穎的長視頻多題問答基準測試,是浙江大學、上海人工智能實驗室、上海交通大學和香港中文大學聯合推出的。MMBench-Video能全面評估大型視覺...
DistilQwen2
DistilQwen2是基于Qwen2大模型用知識蒸餾技術優化得到的輕量級語言模型,能提高運算效率和降低部署成本。DistilQwen2基于深度剖析大模型、增強指令數據多樣性...