用于理解任意視頻中的相機(jī)運(yùn)動(dòng)的工具。
一款具有 17 億參數(shù)的開源圖像生成基礎(chǔ)模型。
提供高級(jí) AI 聊天體驗(yàn),完全私密。
SkyReels V1 是一個(gè)開源的人類中心視頻基礎(chǔ)模型,專注于高質(zhì)量影視級(jí)視頻生成。
HunyuanVideo-I2V 是騰訊推出的基于 HunyuanVideo 的圖像到視頻生成框架。
Llasa-3B 是一個(gè)基于 LLaMA 的文本到語(yǔ)音合成模型,支持中英文語(yǔ)音生成。
Llasa-1B 是一個(gè)基于 LLaMA 的文本轉(zhuǎn)語(yǔ)音 (TTS) 模型,支持中英文語(yǔ)音合成。
一個(gè)基于強(qiáng)化學(xué)習(xí)優(yōu)化的大型語(yǔ)言模型,專注于數(shù)學(xué)問(wèn)題解決能力的提升。
Wan2.1-T2V-14B 是一款高性能的文本到視頻生成模型,支持多種視頻生成任務(wù)。
CSM 1B 是一個(gè)由 Sesame 開發(fā)的文本到語(yǔ)音生成模型,可生成高質(zhì)量的音頻。
提供深度思考推理能力的開源人工智能大模型DeepSeek AI深度推理官網(wǎng)入口網(wǎng)址
將靜態(tài)圖像一鍵轉(zhuǎn)換為高質(zhì)量、語(yǔ)義準(zhǔn)確、時(shí)空連續(xù)的動(dòng)態(tài)視頻。
一個(gè)開源的視頻生成模型,用于創(chuàng)造生動(dòng)的視頻內(nèi)容。
ComfyUI中集成的最新視頻生成模型
一個(gè)擁有8200萬(wàn)參數(shù)的前沿文本到語(yǔ)音(TTS)模型。
Qwen2.5-Coder系列的3B參數(shù)指令調(diào)優(yōu)模型
Qwen2.5-Coder系列中的1.5B參數(shù)代碼生成模型
Qwen2.5-Coder系列中的3B參數(shù)指令調(diào)優(yōu)模型
Qwen2.5-Coder系列中的3B參數(shù)量指令調(diào)優(yōu)模型
Qwen2.5-Coder系列中的1.5B參數(shù)量級(jí)代碼生成模型
高性能英文對(duì)話生成模型
開源視頻生成模型,支持10秒視頻和更高分辨率。
開源代碼生成語(yǔ)言模型
領(lǐng)先的指令遵循模型家族,提供開源數(shù)據(jù)、代碼和指南。
領(lǐng)先的指令遵循模型家族,提供開源數(shù)據(jù)、代碼和配方。
文本圖像到視頻生成模型
一款經(jīng)過(guò)優(yōu)化的大型語(yǔ)言模型,擅長(zhǎng)文本生成和對(duì)話。
開源幻覺評(píng)估模型
一個(gè)專為AI創(chuàng)作者打造的趣玩社區(qū),提供多種AI模型和創(chuàng)作工具,支持用戶進(jìn)行插畫、動(dòng)漫、寫實(shí)等多種風(fēng)格的圖像創(chuàng)作。魔多AI官網(wǎng)入口網(wǎng)址
OpenI AI助手在線工具硅基流動(dòng)豆包Trae扣子Coze即夢(mèng)繪蛙