標簽:內容生成
GroundingBooth
GroundingBooth 是一個先進的文本到圖像定制框架,由華盛頓大學圣路易斯分校、Adobe和普渡大學的研究團隊共同推出。基于文本-圖像對齊模塊和遮罩交叉注意力層...
Baichuan-Omni
Baichuan-Omni 是由百川智能推出的一款開源的 7B 多模態大型語言模型(MLLM),能同時處理和分析圖像、視頻、音頻和文本等多種模態的數據。Baichuan-Omni 提...
Story-Adapter
Story-Adapter 是一種新型的長篇故事可視化框架,能在保持語義一致性的同時,生成高質量且具有細膩交互的故事圖像序列。通過迭代方式,基于全局參考交叉注意...