AI項目和框架

Seed1.5-VL

Seed1.5-VL 是字節跳動 Seed 團隊最新發布的視覺-語言多模態大模型,具備強大的通用多模態理解和推理能力,推理成本顯著降低。模型由一個 532M 參數的視覺編...
閱讀原文

PrimitiveAnything

PrimitiveAnything是騰訊人工智能平臺部(AIPD)和清華大學聯合開發的新型3D形狀生成框架。將復雜的3D形狀分解為簡單的基元元素,通過自回歸方式生成這些基元...
閱讀原文

OptoChat AI

OptoChat AI是南智光電與南京大學共同推出的國內首款光子專用大模型。模型聚焦光子領域全產業鏈,集成超過30萬條光子芯片相關專利、文獻和行業數據資源,具備...
閱讀原文

Xianyu AutoAgent

Xianyu AutoAgent 是為閑魚平臺設計的智能客服機器人系統。支持實現7×24小時自動化值守,多專家協同決策、智能議價及上下文感知對話。基于上下文感知技術,管...
閱讀原文

Matrix-Game

Matrix-Game是昆侖萬維開源的工業界首個10B+空間智能大模型,是Matrix-Zero世界模型中的可交互視頻生成大模型。模型基于兩階段訓練策略,根據用戶輸入生成連...
閱讀原文

GitFriend

GitFriend 是基于 React、TypeScript 和 AI 技術推出的 AI GitHub 輔助工具,能簡化 GitHub 的使用流程,提升開發效率。GitFriend支持基于 AI 聊天功能為用戶...
閱讀原文

Muyan-TTS

Muyan-TTS 是為播客場景設計的開源文本轉語音(TTS)模型。模型預訓練超過10萬小時的播客音頻數據,能實現零樣本語音合成,無需大量目標說話人的語音數據可生...
閱讀原文

Audio-SDS

Audio-SDS是NVIDIA AI研究團隊推出的創新技術,將Score Distillation Sampling(SDS)技術擴展至文本條件音頻擴散模型,為音頻處理領域帶來了重大突破。無需...
閱讀原文

Seed1.5-Embedding

Seed1.5-Embedding 是字節跳動 Seed 團隊最新發布的向量模型,基于 Seed1.5 (Doubao-1.5-pro) 進一步訓練。模型在權威測評榜單 MTEB 上達到了中英文 SOTA 效...
閱讀原文

FastVLM

FastVLM是蘋果推出的高效的視覺語言模型(VLM),能提升高分辨率圖像處理的效率和性能。模型引入FastViTHD新型混合視覺編碼器,有效減少視覺token數量,顯著...
閱讀原文

ZenCtrl

ZenCtrl 是 Fotographer AI 推出的 AI 圖像生成工具,支持從單張圖像生成高質量、多視角和多樣化場景的圖像,無需額外訓練數據。
閱讀原文

Seed-Coder

Seed-Coder是字節跳動開源的8B規模代碼模型系列,提升代碼生成與理解能力。包含Base、Instruct和Reasoning三個版本,分別適用于代碼補全、指令遵循和復雜推理...
閱讀原文

LegoGPT

LegoGPT 是卡內基梅隆大學推出的樂高積木設計模型,支持基于文本提示生成物理穩定且能構建的樂高積木模型。LegoGPT 基于自回歸語言模型和大規模樂高設計數據...
閱讀原文

BILIVE

BILIVE 是一款基于 AI 技術的開源工具,專為 B 站直播錄制與處理設計。工具支持自動錄制直播、渲染彈幕和字幕,支持語音識別、自動切片精彩片段,生成有趣的...
閱讀原文

LTXV-13B

LTXV-13B 是Lightricks推出的開源 AI 視頻生成模型,擁有 130 億參數。具備極高的生成速度,比同類產品快 30 倍,能在普通消費級顯卡(如 4090/5090)上運行...
閱讀原文
13132333435146