Monoid是一款強大的AI平臺,可以將API轉化為智能代理,幫助用戶實現自動化操作,提供靈活定制、實時響應的智能代理服務。,Monoid官網入口網址
pixels2flutter是一款強大的截圖轉換工具,可以將UI截圖快速轉換為實際可用的Flutter代碼,提高開發效率和用戶體驗。,Pixels2Flutter官網入口網址
Kel是一個智能的命令行助手,支持多種語言模型,可以幫助用戶解答問題、提供技術支持和進行文件交互。,Kel官網入口網址
Instill AI是一個開源社區,通過現代數據堆棧賦能人工智能,挖掘非結構化數據的價值。他們的產品Instill Cloud是一個無代碼/低代碼平臺,可以加速AI應用程序的開發。用戶可以輕松連接各種數據源,無縫集成AI模型,并以極快的速度部署定制邏輯。,Instill官網入口網址
一個完全開源的AI軟件工程師,5分鐘就能在本地電腦部署。
一款由騰訊研究人員開發的音頻驅動的肖像動畫合成框架,AniPortrait能夠根據音頻和靜態人臉圖片生成逼真的動態視頻。AniPortrait官網入口網址
一個專注于動漫圖像超分辨率的項目,旨在恢復和增強來自現實世界場景的低質量、低分辨率動漫圖像和視頻源。APISR官網入口網址
一種基于區域語義控制的實時交互生成圖像方法,主要用于圖像生成和編輯應用。它基于擴散模型在文本到圖像合成中的成功,旨在通過減少推理時間和提高生成圖像的質量來提高擴散模型的可用性。StreamMultiDiffusion官網入口網址
一款漂亮且功能強大的在線海報設計器,圖片編輯器,仿稿定設計,迅排設計Poster-Design適用于海報生成、電商產品圖、文章長圖、視頻/公眾號封面等多種場景。迅排設計官網入口網址
論文大師系統源碼,可SaaS租用或者源碼部署
一個開源的文本生成圖像動漫模型,通過整合新的數據集,Animagine XL 3.1擴展了對廣泛動漫作品和風格的理解,從經典作品到最新發布的動漫,覆蓋了從古老到現代的各種藝術風格。Animagine XL 3.1官網入口網址
毫不費力地改變圖像和視頻中的照明,實現超逼真的效果。使用Beeble AI 的創新技術,通過逼真的燈光效果增強您的創作。Beeble AI官網入口網址
一個可擴展、功能豐富且用戶友好的自托管 WebUI,適用于各種 LLM 運行器,支持的 LLM 運行器包括 Ollama 和 OpenAI 兼容的 API。Open WebUI官網入口網址
一個使用nextjs創建的用于生成 Sora AI視頻的開源Web模板。Sora.FM官網入口網址
一個開源項目,允許用戶使用 OpenAI Sora 模型使用文本在線生成視頻,從而簡化視頻創建,并具有輕松的一鍵網站部署功能。SoraWebui官網入口網址
一個高度可控的虛擬模特服裝試穿開源工具,OOTDiffusion可以根據不同性別和體型自動調整服裝,可控試穿參數,自然融合與逼真效果。OOTDiffusion官網入口網址
一個能夠錄下你的語音內容,然后自動幫助你把這些語音轉成文字,對內容進行總結,并且生成相關的任務列表的AI筆記工具。notesGPT官網入口網址
自動創建YouTube短視頻的自動化賺錢項目,只要輸入視頻文本MoneyPrinter即可自動產生與之相關的短視頻。MoneyPrinter官網入口網址
騰訊AI實驗室開發的一個實時目標檢測工具,它能夠自動識別和定位圖像中的各種對象,YOLO-World官網入口網址
一款由AI驅動的應用程序,通過語音生成富有表現力的3D面部動畫。Audio2Face官網入口網址
一款革命性的語音面部動畫生成工具,借助 Media2Face,現在可以從任何音頻、圖像或文本輸入無縫生成逼真且富有表現力的面部動畫。Media2Face官網入口網址
一個基于WhisperLive把聲音轉文字和WhisperSpeech理解這些文字的能力構建。能夠與AI聊天機器人進行超低延遲對話。WhisperFusion官網入口網址
一個視頻搜索和流媒體代理工具,能讓您在 ChatGPT 中與您的視頻庫聊天并觀看視頻流。StreamRAG官網入口網址
一個專門為DuckDB數據庫設計的文本到SQL的模型,你可以使用自然語言說描述你的需求,它會自動轉換成SQL代碼。DuckDB-NSQL官網入口網址
一種基于擴散的圖像修復模型,主要用于虛擬試穿場景。它能夠在修復圖像時保留參考物品的細節,適用于在線購物等虛擬試穿場景中的圖像修復任務。Diffuse to Choose官網入口網址
基于大規模擴散的高保真通用圖像恢復模型,SupIR能夠根據文本提示進行智能修復,提高圖像修復的質量和智能程度。SupIR官網入口網址
FunASR是一個基礎語音識別工具包,提供多種功能,包括語音識別(ASR)、語音端點檢測(VAD)、標點恢復、語言模型、說話人驗證、說話人分離和多人對話語音識別等。FunASR提供了便捷的腳本和教程,支持預訓練好的模型的推理與微調,FunASR 基礎語音識別工具包官網入口網址
谷歌研究院開發的基于空間時間的文本到視頻擴散模型。采用了創新的空間時間U-Net架構,能夠一次性生成整個視頻的時間長度,確保了生成視頻的連貫性和逼真度。Lumiere官網入口網址
一個為黑白圖像上色的魔搭模型,通過雙解碼器實現逼真的圖像著色,輸入一張黑白圖像,實現端到端的全圖上色,返回上色處理后的彩色圖像。,DDColor官網入口網址
網易有道一個開源的本地知識庫問答系統,旨在支持多種文件格式和數據庫,允許離線安裝和使用。,QAnything官網入口網址
字節跳動開發的由LLM驅動文本生成圖像多合一系統,專門設計用于為不同的輸入提示生成高質量的圖像。DiffusionGPT官網入口網址
一個聲音克隆和文本到語音轉換的開源 Python RAG框架,只需1分鐘語音即可訓練一個自己的TTS模型。GPT-SoVITS官網入口網址
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙