AI項目和框架
Mobile-Agent
Mobile-Agent 是具有移動性的智能代理軟件實體,能在網絡的各個節點之間移動,代表用戶或其他代理進行工作。能根據具體情況中斷當前執行,移動至另一設備上恢...
VideoAnydoor
VideoAnydoor是香港大學、阿里巴巴集團達摩院、湖畔實驗室、華中科技大學聯合推出的零樣本的視頻對象插入框架,能將特定對象以高保真度和精確運動控制的方式...
PersonaMagic
PersonaMagic 是創新的高保真人臉定制技術,通過階段調節的文本條件策略實現個性化圖像生成。基于簡單多層感知機(MLP)網絡學習一系列動態嵌入,在特定時間...
InstructMove
InstructMove是東京大學和Adobe公司聯合推出的基于指令的圖像編輯模型,通過觀察視頻中的幀對變化學習如何根據指令進行圖像操作。模型基于多模態大型語言模型...
LatentSync
LatentSync是字節跳動、北京交通大學聯合推出的端到端唇形同步框架,基于音頻條件的潛在擴散模型,無需任何中間的3D表示或2D特征點。LatentSync用Stable Diff...
DeepSeek Artifacts
DeepSeek Artifacts是Hugging Face推出的免費AI編碼器工具,能生成React和Tailwind CSS的前端代碼。工具基于DeepSeek V3,主要目標是構建公共的前端代碼數據...
Jina Reader
Jina Reader 是 Jina AI 推出的開源工具,能將互聯網上的 HTML 網頁內容轉換為適合大型語言模型(LLMs)處理的純文本格式。用戶只需在網址前添加特定前綴,即...
粵公網安備 44011502001135號