AI項目和框架

Co-Sight

Co-Sight是中興通訊開源的超級智能體項目,為協同視覺分析平臺及智能自動化底座。采用多智能體架構,構建“數字團隊”協同體系,通過DAG任務引擎驅動,實現任務...
閱讀原文

HealthBench

HealthBench是OpenAI推出的醫療開源測試基準,用在評估大型語言模型(LLMs)在醫療保健領域的表現和安全性。HealthBench包含5000個模型與用戶或醫療專業人員...
閱讀原文

Chinese-LiPS

Chinese-LiPS 是智源研究院聯合南開大學共同打造的高質量中文多模態語音識別數據集,包含100小時的語音、視頻和手動轉錄文本,創新性地融合了唇讀視頻和演講...
閱讀原文

ViLAMP

ViLAMP(VIdeo-LAnguage Model with Mixed Precision)是螞蟻集團和中國人民大學聯合推出的視覺語言模型,專門用在高效處理長視頻內容。基于混合精度策略,對...
閱讀原文

Seed1.5-VL

Seed1.5-VL 是字節跳動 Seed 團隊最新發布的視覺-語言多模態大模型,具備強大的通用多模態理解和推理能力,推理成本顯著降低。模型由一個 532M 參數的視覺編...
閱讀原文

PrimitiveAnything

PrimitiveAnything是騰訊人工智能平臺部(AIPD)和清華大學聯合開發的新型3D形狀生成框架。將復雜的3D形狀分解為簡單的基元元素,通過自回歸方式生成這些基元...
閱讀原文

OptoChat AI

OptoChat AI是南智光電與南京大學共同推出的國內首款光子專用大模型。模型聚焦光子領域全產業鏈,集成超過30萬條光子芯片相關專利、文獻和行業數據資源,具備...
閱讀原文

Xianyu AutoAgent

Xianyu AutoAgent 是為閑魚平臺設計的智能客服機器人系統。支持實現7×24小時自動化值守,多專家協同決策、智能議價及上下文感知對話。基于上下文感知技術,管...
閱讀原文

Matrix-Game

Matrix-Game是昆侖萬維開源的工業界首個10B+空間智能大模型,是Matrix-Zero世界模型中的可交互視頻生成大模型。模型基于兩階段訓練策略,根據用戶輸入生成連...
閱讀原文

GitFriend

GitFriend 是基于 React、TypeScript 和 AI 技術推出的 AI GitHub 輔助工具,能簡化 GitHub 的使用流程,提升開發效率。GitFriend支持基于 AI 聊天功能為用戶...
閱讀原文

Muyan-TTS

Muyan-TTS 是為播客場景設計的開源文本轉語音(TTS)模型。模型預訓練超過10萬小時的播客音頻數據,能實現零樣本語音合成,無需大量目標說話人的語音數據可生...
閱讀原文

Audio-SDS

Audio-SDS是NVIDIA AI研究團隊推出的創新技術,將Score Distillation Sampling(SDS)技術擴展至文本條件音頻擴散模型,為音頻處理領域帶來了重大突破。無需...
閱讀原文

Seed1.5-Embedding

Seed1.5-Embedding 是字節跳動 Seed 團隊最新發布的向量模型,基于 Seed1.5 (Doubao-1.5-pro) 進一步訓練。模型在權威測評榜單 MTEB 上達到了中英文 SOTA 效...
閱讀原文

FastVLM

FastVLM是蘋果推出的高效的視覺語言模型(VLM),能提升高分辨率圖像處理的效率和性能。模型引入FastViTHD新型混合視覺編碼器,有效減少視覺token數量,顯著...
閱讀原文

ZenCtrl

ZenCtrl 是 Fotographer AI 推出的 AI 圖像生成工具,支持從單張圖像生成高質量、多視角和多樣化場景的圖像,無需額外訓練數據。
閱讀原文