Skywork-Reward-V2
Skywork-Reward-V2是昆侖萬維開源的第二代獎(jiǎng)勵(lì)模型系列,包含基于不同基座模型和大小的8個(gè)模型,參數(shù)規(guī)模從6億到80億不等。Skywork-Reward-V2系列模型在七大...
MuseSteamer
MuseSteamer是百度推出的多模態(tài)AI視頻生成大模型。模型能根據(jù)輸入的圖片或文字提示,生成高質(zhì)量的動(dòng)態(tài)視頻,支持電影級(jí)畫質(zhì)和音效一體化生成。
Step-Audio-AQAA
Step-Audio-AQAA 是 StepFun 團(tuán)隊(duì)推出的端到端大型音頻語言模型,專門用于音頻查詢-音頻回答(AQAA)任務(wù)。能直接處理音頻輸入生成自然、準(zhǔn)確的語音回答,無...
GLM-4.1V-Thinking
GLM-4.1V-Thinking是智譜AI推出的開源視覺語言模型,專為復(fù)雜認(rèn)知任務(wù)設(shè)計(jì),支持圖像、視頻、文檔等多模態(tài)輸入。模型在GLM-4V架構(gòu)基礎(chǔ)上引入思維鏈推理機(jī)制,...
BlenderFusion
BlenderFusion是Google DeepMind推出的生成式視覺合成框架,將傳統(tǒng)的 3D 編輯軟件(Blender)與AI 模型相結(jié)合,實(shí)現(xiàn)精準(zhǔn)的幾何編輯和多樣的視覺合成。