AI項目和框架
PersonaTalk
PersonaTalk是字節跳動推出的基于注意力機制的兩階段框架,用在實現高保真度和個性化的視覺配音。PersonaTalk能在合成與目標音頻精準唇形同步的視頻的同時,...
SynthID Text
SynthID Text 是谷歌DeepMind 推出的文本水印技術,用在識別和驗證由大型語言模型(LLM)生成的文本。基于細微調整生成過程中的Token概率分數嵌入幾乎無法察...
DriveDreamer4D
DriveDreamer4D是用在提升自動駕駛場景4D重建質量的框架,基于世界模型先驗增強4D駕駛場景的表示。框架能基于真實世界的駕駛數據合成新的軌跡視頻,用明確結...
SDXL-EcomID
SDXL-EcomID是阿里媽媽推出的開源項目,從單個參考圖像生成定制的個性圖像。融合PuLID和InstantID的優點,優化背景一致性、面部關鍵點控制和面部真實性,提高...
GitHub Spark
GitHub Spark是GitHub推出的AI編程工具,支持GPT-4o、Claude Sonnet 3.5等四款編程模型。用戶無需任何代碼和部署環境,基于自然語言描述需求,能在桌面或移動...