AI項目和框架
Gemma 3 QAT
Gemma 3 QAT(Quantization-Aware Training)是谷歌推出的最新一代開源模型,是Gemma 3 的量化優化版本。通過量化感知訓練技術,Gemma 3 QAT 在顯著降低內存...
OpenUtau
OpenUtau 是開源的歌聲合成工具,兼容 UTAU 音源庫和重采樣器,支持 VSQX 導入、多語言界面及預渲染功能,幫助創作者快速預覽作品節省時間。OpenUtau現代化的...
SkyReels-V2
SkyReels-V2是昆侖萬維SkyReels團隊推出的無限時長電影生成模型,基于擴散強迫(Diffusion-forcing)框架,結合多模態大語言模型(MLLM)、多階段預訓練、強...
FastAPI-MCP
FastAPI-MCP 是將 FastAPI 應用的端點自動轉換為符合模型上下文協議(MCP)的開源工具。具有零配置的特點,只需簡單指向 FastAPI 應用可自動發現并轉換所有端...
豆包1.5·UI-TARS
豆包1.5·UI-TARS是字節豆包推出的面向圖形界面交互(GUI)的Agent模型。模型基于感知、推理和動作執行等類人能力,與圖形界面進行連續、流暢的交互。模型將視...