一款革命性的語音面部動畫生成工具,借助 Media2Face,現在可以從任何音頻、圖像或文本輸入無縫生成逼真且富有表現力的面部動畫。Media2Face官網入口網址
一個基于WhisperLive把聲音轉文字和WhisperSpeech理解這些文字的能力構建。能夠與AI聊天機器人進行超低延遲對話。WhisperFusion官網入口網址
一個視頻搜索和流媒體代理工具,能讓您在 ChatGPT 中與您的視頻庫聊天并觀看視頻流。StreamRAG官網入口網址
一個專門為DuckDB數據庫設計的文本到SQL的模型,你可以使用自然語言說描述你的需求,它會自動轉換成SQL代碼。DuckDB-NSQL官網入口網址
一種基于擴散的圖像修復模型,主要用于虛擬試穿場景。它能夠在修復圖像時保留參考物品的細節,適用于在線購物等虛擬試穿場景中的圖像修復任務。Diffuse to Choose官網入口網址
基于大規模擴散的高保真通用圖像恢復模型,SupIR能夠根據文本提示進行智能修復,提高圖像修復的質量和智能程度。SupIR官網入口網址
FunASR是一個基礎語音識別工具包,提供多種功能,包括語音識別(ASR)、語音端點檢測(VAD)、標點恢復、語言模型、說話人驗證、說話人分離和多人對話語音識別等。FunASR提供了便捷的腳本和教程,支持預訓練好的模型的推理與微調,FunASR 基礎語音識別工具包官網入口網址
谷歌研究院開發的基于空間時間的文本到視頻擴散模型。采用了創新的空間時間U-Net架構,能夠一次性生成整個視頻的時間長度,確保了生成視頻的連貫性和逼真度。Lumiere官網入口網址
一個為黑白圖像上色的魔搭模型,通過雙解碼器實現逼真的圖像著色,輸入一張黑白圖像,實現端到端的全圖上色,返回上色處理后的彩色圖像。,DDColor官網入口網址
網易有道一個開源的本地知識庫問答系統,旨在支持多種文件格式和數據庫,允許離線安裝和使用。,QAnything官網入口網址
字節跳動開發的由LLM驅動文本生成圖像多合一系統,專門設計用于為不同的輸入提示生成高質量的圖像。DiffusionGPT官網入口網址
一個聲音克隆和文本到語音轉換的開源 Python RAG框架,只需1分鐘語音即可訓練一個自己的TTS模型。GPT-SoVITS官網入口網址
一個增強版免費開源的ChatGPT程序,LibreChat 是一個免費開源的聊天機器人平臺,集成了多種 AI 模型。LibreChat官網入口網址
AI角色動畫工具,通過先進的視頻處理和3D渲染技術,MotionShop能夠高效地將視頻中的某個角色替換為3D人物,同時不改變視頻中的其他場景和人物。Motionshop官網入口網址
PhotoMaker:利用多張照片作為身份ID,獲取人物特征,然后根據描述生成一個新的、個性化的人物圖像。PhotoMaker官網入口網址
EmotiVoice是一個強大的開源TTS引擎,完全免費,支持中英文雙語,包含2000多種不同的音色,以及特色的情感合成功能,支持合成包含快樂、興奮、悲傷、憤怒等廣泛情感的語音。,EmotiVoice官網入口網址
一鍵免費部署你的跨平臺私人 ChatGPT 應用, 支持 GPT3, GPT4 & Gemini Pro 模型。(基于 LangChain 實現插件功能),ChatGPT-Next-Web-LangChain官網入口網址
一個面部圖像精準恢復和個性編輯技術工具,不僅能復原受損圖像細節,同時能精準捕捉和重現個人獨特的面部特征。同時它還支持換臉。Personalized Restoration官網入口網址
專門用于生成 SQL 語句的模型,sqlcoder官網入口網址
自動為視頻生成高亮字幕,AutoCaption官網入口網址
基于ChatGPT的微信機器人,chatgpt-on-wechat官網入口網址
LlamaIndex 推出聊天機器人應用,支持設置prompt、上傳文件聊天、分享聊天,基本是一鍵部署。,chat-llamaindex官網入口網址
一個可以自己托管的 Whisper 解決方案,服務端是 Python,客戶端是 JS,基于 WebSocket 實時通信,可以做到語音的實時傳輸和文本轉換。,VoiceStreamAI官網入口網址
一種用于構建人工智能代理的反應式運行時,Chidori官網入口網址
一個使用自然語言進行交流的應用程序,它是通過 OpenAI Functions 和 Vercel AI SDK 構建的,Chat with Hacker News官網入口網址
一個非常實用的PDF轉HTML工具,可以幫助用戶輕松地將PDF文件轉換為可在網頁瀏覽器中查看的格式。,pdf2htmlEX官網入口網址
Mac 上的一個多模態 AI 助手,能支持語音和截圖,借助 GPT-4V 的多模態能力,可以基于當前屏幕截圖和指令可以回復問題。,macOSpilot官網入口網址
一個輕量級的 JavaScript(沒有依賴項),為 SVG 設置動畫,使它們看起來像是被繪制的,Vivus官網入口網址
識別視頻中的人物的面部和身...
借助大語言模型(LLM)處理音頻的工具,AudioGPT官網入口網址
給出一段長視頻,我們把它變成一個包含視覺+音頻信息的文檔。通過將這份文件發送給ChatGPT,我們就可以在視頻中進行聊天了!,VLog官網入口網址
基于瀏覽器的前端Web界面,支持本地或遠程AI模型,用于搭建輔助寫作、類AI Dungeon游戲、聊天機器人。,KoboldAI-Client官網入口網址
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙