AI項目和框架
EveryoneNobel
EveryoneNobel是一個開源AI工具,為每個人生成個性化的諾貝爾獎風格圖像。EveryoneNobel基于ComfyUI框架,結合HTML模板和圖像生成技術,用戶只需上傳肖像照片...
TextHarmony
TextHarmony是華東師范大學和字節跳動共同推出的多模態生成模型,擅長理解和生成視覺文本。模型基于Slide-LoRA技術,動態聚合特定于模態和模態無關的LoRA專家...
NotebookLlama
NotebookLlama是Meta推出的將PDF文檔轉換成播客內容的開源項目。項目基于一系列自動化步驟實現,用LLaMa模型進行PDF預處理、生成播客腳本、增加戲劇化元素及...
WonderWorld
WonderWorld是斯坦福大學和麻省理工學院共同推出的創新性3D場景生成框架,能從單張圖片快速生成多樣化且連貫的3D虛擬世界。基于核心的Fast LAyered Gaussian ...
PersonaTalk
PersonaTalk是字節跳動推出的基于注意力機制的兩階段框架,用在實現高保真度和個性化的視覺配音。PersonaTalk能在合成與目標音頻精準唇形同步的視頻的同時,...
SynthID Text
SynthID Text 是谷歌DeepMind 推出的文本水印技術,用在識別和驗證由大型語言模型(LLM)生成的文本。基于細微調整生成過程中的Token概率分數嵌入幾乎無法察...
DriveDreamer4D
DriveDreamer4D是用在提升自動駕駛場景4D重建質量的框架,基于世界模型先驗增強4D駕駛場景的表示。框架能基于真實世界的駕駛數據合成新的軌跡視頻,用明確結...