AI項目和框架
Flux.1 Lite
Flux.1 Lite是Freepik團隊推出的輕量級AI模型,目前處于alpha版本。Flux.1 Lite是基于80億參數(shù)的transformer架構(gòu),從FLUX.1-dev模型中提取而來。Flux.1 Lite...
FakeShield
FakeShield是北京大學(xué)研究人員推出的多模態(tài)大型語言模型框架,能檢測和定位圖像偽造??蚣苣茉u估圖像的真實性,生成被篡改區(qū)域的掩碼,提供基于像素級和圖像...
GLM-4-Voice
GLM-4-Voice是智譜AI推出的端到端情感語音模型,能直接理解和生成中英文語音,支持實時語音對話,能根據(jù)用戶指令靈活調(diào)整語音的情感、語調(diào)、語速和方言等特征...
EveryoneNobel
EveryoneNobel是一個開源AI工具,為每個人生成個性化的諾貝爾獎風(fēng)格圖像。EveryoneNobel基于ComfyUI框架,結(jié)合HTML模板和圖像生成技術(shù),用戶只需上傳肖像照片...
TextHarmony
TextHarmony是華東師范大學(xué)和字節(jié)跳動共同推出的多模態(tài)生成模型,擅長理解和生成視覺文本。模型基于Slide-LoRA技術(shù),動態(tài)聚合特定于模態(tài)和模態(tài)無關(guān)的LoRA專家...
NotebookLlama
NotebookLlama是Meta推出的將PDF文檔轉(zhuǎn)換成播客內(nèi)容的開源項目。項目基于一系列自動化步驟實現(xiàn),用LLaMa模型進行PDF預(yù)處理、生成播客腳本、增加戲劇化元素及...
WonderWorld
WonderWorld是斯坦福大學(xué)和麻省理工學(xué)院共同推出的創(chuàng)新性3D場景生成框架,能從單張圖片快速生成多樣化且連貫的3D虛擬世界?;诤诵牡腇ast LAyered Gaussian ...