CustomVideoX
CustomVideoX 是中科大和浙大等聯合提出的創新的個性化視頻生成框架,通過參考圖像和文本描述生成高質量的定制化視頻。框架基于視頻擴散變換器(Video Diffus...
Collaborative Gym
Collaborative Gym(Co-Gym)是專注于人機協作(Human-Agent Collaboration)的框架,支持人類與AI代理之間的實時交互與協作。通過模擬和真實兩種實驗條件,...
WebLI-100B
WebLI-100B是Google DeepMind推出的包含1000億圖像-文本對的超大規模數據集,用在預訓練視覺語言模型(VLMs)。WebLI-100B是WebLI數據集的擴展版本,基于從網...
OpenThinker-32B
OpenThinker-32B 是斯坦福、UC 伯克利、華盛頓大學等機構聯合開發的開源推理模型,擁有 328 億參數,支持 16,000 token 的上下文長度。模型僅使用 114k 數據...