AI項(xiàng)目和框架
DreamVideo-2
DreamVideo-2是創(chuàng)新的零樣本視頻定制框架,是復(fù)旦大學(xué)和阿里巴巴集團(tuán)等機(jī)構(gòu)聯(lián)合推出。DreamVideo-2能根據(jù)單一圖像和界定框序列生成具有特定主題和精確運(yùn)動軌...
NotebookMLX
NotebookMLX是開源版本的NotebookLM,集成NotebookLlama的功能,能將PDF文檔轉(zhuǎn)換成易于理解和分享的音頻播客形式。項(xiàng)目基于MLX技術(shù)實(shí)現(xiàn)自然語言處理功能,包...
Voice Changer
Voice Changer是Cartesia推出的新模型,能將任何音頻剪輯的語音轉(zhuǎn)換成其他音色,且保留原始音頻的情感和表達(dá)。用戶從Cartesia提供的多種高質(zhì)量聲音庫中選擇,...
Genmoai-smol
Genmoai-smol是開源視頻生成模型,是Genmoai的txt2video模型的工作進(jìn)展分支,專為單GPU設(shè)備優(yōu)化,減少顯存占用,在資源有限的設(shè)備上能進(jìn)行視頻創(chuàng)作。模型用高...
Self-Lengthen
Self-Lengthen是阿里巴巴千問團(tuán)隊(duì)推出的創(chuàng)新的迭代訓(xùn)練框架,能提升大型語言模型(LLMs)生成長文本的能力。框架基于兩個角色,生成器和擴(kuò)展器協(xié)同工作,生成...