通過將靜態(tài)內(nèi)容與時間變形結(jié)合,為視頻處理提供了新的視角和工具,CoDeF官網(wǎng)入口網(wǎng)址
高級語音和Deepfake神經(jīng)網(wǎng)絡(luò)工具,Wunjo官網(wǎng)入口網(wǎng)址
一個簡潔、易于使用的控制臺記錄器,具有多彩的日志輸出、時間戳和性能統(tǒng)計、自定義日志級別和輸出位置以及錯誤追蹤和堆棧跟蹤等功能。,Consola官網(wǎng)入口網(wǎng)址
音頻轉(zhuǎn)文字,Bark官網(wǎng)入口網(wǎng)址
可以爬取指定網(wǎng)站中的內(nèi)容,并生成json文件,可以直接上傳到GPTs的知識庫使用。,gpt-crawler官網(wǎng)入口網(wǎng)址
一個功能強大的數(shù)據(jù)庫工具,...
一種分層自適應(yīng)零樣本語音風格轉(zhuǎn)換模型,HierVST官網(wǎng)入口網(wǎng)址
一個基于飛槳(PaddlePaddle)的跨模態(tài)大模型開發(fā)套件,旨在聚合圖像、文本、視頻等多種模態(tài),以支持各種跨模態(tài)任務(wù),PaddleMIX官網(wǎng)入口網(wǎng)址
全文本搜索引擎庫,Tantivy官網(wǎng)入口網(wǎng)址
一個用于音頻處理和生成的深度學習庫,Audiocraft官網(wǎng)入口網(wǎng)址
一個將穩(wěn)定擴散模型引入Web瀏覽器的項目,web-stable-diffusion官網(wǎng)入口網(wǎng)址
將屏幕截圖轉(zhuǎn)換為清潔的HTML / Tailwind / JS代碼,screenshot-to-code官網(wǎng)入口網(wǎng)址
網(wǎng)易有道一個開源的本地知識庫問答系統(tǒng),旨在支持多種文件格式和數(shù)據(jù)庫,允許離線安裝和使用。QAnything AI官網(wǎng)入口網(wǎng)址
ChatGPT 的開源、托管替代品,jan.ai可在您的計算機上100%離線運行。Jan.ai官網(wǎng)入口網(wǎng)址
基于AI大語言模型 API 實現(xiàn)的 AI 助手全套開源解決方案,自帶運營管理后臺,開箱即用。集成了 OpenAI, Azure, ChatGLM,訊飛星火,文心一言等多個平臺的大語言模型。集成了 MidJourney 和 Stable Diffusion AI繪畫功能。ChatGPT-Plus官網(wǎng)入口網(wǎng)址
文生3D數(shù)字人工具,借助 Make-A-Character,您可以毫不費力地從文本描述中生成可控、逼真、可動畫的3D數(shù)字人角色。Make-A-Character官網(wǎng)入口網(wǎng)址
從音頻生成全身逼真的虛擬人物形象。它可以從多人對話中語音中生成與對話相對應(yīng)的逼真面部表情、完整身體和手勢動作。Audio2Photoreal官網(wǎng)入口網(wǎng)址
一種從單個圖像到一致的多視圖擴散基礎(chǔ)模型,旨在使用單視圖輸入生成 3D 一致的多視圖圖像。Zero123官網(wǎng)入口網(wǎng)址
該模型利用面部識別模型的面部ID嵌入,可以更準確地捕捉和再現(xiàn)特定人物的面部特征。IP-Adapter-FaceID結(jié)合文本描述生成可以生成高度個性化且與原始面部特征一致的圖像。IP-Adapter-FaceID官網(wǎng)入口網(wǎng)址
一個AI自動投遞簡歷的工具,結(jié)合chatgpt與rpa技術(shù),實現(xiàn)一鍵自動尋找工作、根據(jù)自己的簡歷和工作描述生成求職信、發(fā)送給hr的全流程自動操作。賽博投簡歷官網(wǎng)入口網(wǎng)址
一個高質(zhì)量視頻生成的開放式擴散模型,相比之前的生成視頻模型,VideoDrafter最大的特點是能在主體不變的基礎(chǔ)上,一次性生成多個場景的視頻。VideoDrafter官網(wǎng)入口網(wǎng)址
一個由清華大學、阿里巴巴和華中科大共同開發(fā)的一個基于擴散模型可以讓人物照片說話,支持包括歌曲、多種語言的語音、嘈雜的音頻在內(nèi)的各種聲音匹配讓人物頭像說話的框架。DreamTalk官網(wǎng)入口網(wǎng)址
一款融合了音樂理解和多模態(tài)音樂生成任務(wù),旨在助力用戶進行音樂藝術(shù)創(chuàng)作的引領(lǐng)潮流的框架。M2UGen官網(wǎng)入口網(wǎng)址
一個開源的 AI 圖像重繪增強工具,通過使用最新的 BSR Gan技術(shù),可以將低分辨率圖像提升至高分辨率并修復和增強圖像的細節(jié)。DemoFusion官網(wǎng)入口網(wǎng)址
解決AI圖像生成中手部畸形的問題 目前的圖像生成模型,再生成圖像方面已經(jīng)非常出色,但在生成人類手部的圖像時卻常常出現(xiàn)問題,比如手指數(shù)量不對或者手形怪異。HandRefiner官網(wǎng)入口網(wǎng)址
AnyDoor,由香港大學、阿里巴巴和螞蟻集團聯(lián)合研發(fā)AnyDoor,可以將一張照片上的任何物品傳送到另一張圖片的世界中。AnyDoor官網(wǎng)入口網(wǎng)址
PIA是一款個性化圖像動畫生成器,可以生成具有高運動可控性和強文本和圖像對齊性的視頻,與條件圖像對齊,通過文本實現(xiàn)動作控制,與各種個性化T2I模型兼容,無需特定調(diào)整。PIA官網(wǎng)入口網(wǎng)址
LucidDreamer,可以從單個圖像的單個文本提示中生成可導航的3D場景。 單擊并拖動(導航)/移動和滾動(縮放)以感受3D。LucidDreamer官網(wǎng)入口網(wǎng)址
DreaMoving,一種基于擴散的可控視頻生成框架,用于生成高質(zhì)量的定制人類舞蹈視頻。DreaMoving官網(wǎng)入口網(wǎng)址
Gemini是Google DeepMind推出的全新AI模型,集成了多模態(tài)推理功能,超越了以往模型的性能,適用于科學文獻洞察、競爭性編程等多種應(yīng)用場景。Gemini官網(wǎng)入口網(wǎng)址
EasyPhoto是一個用于生成AI肖像的Webui UI插件,可以用來訓練與你相關(guān)的數(shù)字化替身。EasyPhoto官網(wǎng)入口網(wǎng)址
FaceChain是一個可以用來打造...
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙