AI項目和框架
Seed1.5-Embedding
Seed1.5-Embedding 是字節跳動 Seed 團隊最新發布的向量模型,基于 Seed1.5 (Doubao-1.5-pro) 進一步訓練。模型在權威測評榜單 MTEB 上達到了中英文 SOTA 效...
Seed-Coder
Seed-Coder是字節跳動開源的8B規模代碼模型系列,提升代碼生成與理解能力。包含Base、Instruct和Reasoning三個版本,分別適用于代碼補全、指令遵循和復雜推理...
PixelHacker
PixelHacker 是華中科技大學和 VIVO AI Lab聯合推出的圖像修復(Image Inpainting)模型。基于引入潛在類別引導(Latent Categories Guidance, LCG)范式,分...
Scenethesis
Scenethesis 是 NVIDIA 推出的創新框架,用在從文本生成交互式 3D 場景。框架結合大型語言模型(LLM)和視覺感知技術,基于多階段流程實現高效生成,用 LLM ...
VITA-Audio
VITA-Audio 是開源的端到端多模態語音大模型,具有低延遲、推理速度快的特點。通過輕量級的多模態交叉標記預測(MCTP)模塊,可在首次前向傳播中生成音頻輸出...
Parakeet TDT 0.6B
Parakeet TDT 0.6B 是英偉達推出的開源自動語音識別(ASR)模型。采用FastConformer編碼器和TDT解碼器架構,通過預測文本標記及其持續時間加速推理,減少計算...
粵公網安備 44011502001135號