標簽:自然語言處理
Qwen2.5-VL-32B
Qwen2.5-VL-32B是阿里巴巴開源的多模態模型,參數規模為32B。模型在Qwen2.5-VL系列的基礎上,基于強化學習優化,具備更符合人類偏好的回答風格、顯著提升的數...
LHM
LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通義實驗室推出的從單張圖像重建可動畫化3D人體模型。基于多模態Transformer架構,融合3D幾何...
LongCat
LongCat(龍貓)是美團自主研發的生成式大語言模型,通過人工智能技術提升公司內部工作效率和創新能力。模型具備強大的多模態能力,能處理文本、圖像等多種數...
GPT-4o mini TTS
GPT-4o mini TTS 是 OpenAI 推出的輕量級文本轉語音模型,支持將文本內容轉換為自然流暢語音的同時,開發者能用指令控制語音的語調、情感和風格,例如“平靜”“...