標簽:多語言翻譯
VITA-Audio
VITA-Audio 是開源的端到端多模態語音大模型,具有低延遲、推理速度快的特點。通過輕量級的多模態交叉標記預測(MCTP)模塊,可在首次前向傳播中生成音頻輸出...
Gemini 2.5 Pro
Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一個“思考模型”,能在回應前進行推理,提升性能和準確性。模型在多個基準測試中表現卓越,在推理和代碼生成方面...
OLMo 2 32B
OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新開源語言模型,是 OLMo 2 系列的重要成果。擁有 320 億參數,是首個在多技能學術基準測試中超越 GPT-...
Tough Tongue AI 2.0
Tough Tongue AI 2.0 是多模態對話練習工具,幫助用戶應對各種困難對話場景而設計。支持創建和分享多種對話場景,如面試、職場溝通、銷售談判等,提供智能對...