pixels2flutter是一款強大的截圖轉(zhuǎn)換工具,可以將UI截圖快速轉(zhuǎn)換為實際可用的Flutter代碼,提高開發(fā)效率和用戶體驗。,Pixels2Flutter官網(wǎng)入口網(wǎng)址
Kel是一個智能的命令行助手,支持多種語言模型,可以幫助用戶解答問題、提供技術(shù)支持和進行文件交互。,Kel官網(wǎng)入口網(wǎng)址
Instill AI是一個開源社區(qū),通過現(xiàn)代數(shù)據(jù)堆棧賦能人工智能,挖掘非結(jié)構(gòu)化數(shù)據(jù)的價值。他們的產(chǎn)品Instill Cloud是一個無代碼/低代碼平臺,可以加速AI應(yīng)用程序的開發(fā)。用戶可以輕松連接各種數(shù)據(jù)源,無縫集成AI模型,并以極快的速度部署定制邏輯。,Instill官網(wǎng)入口網(wǎng)址
一個完全開源的AI軟件工程師,5分鐘就能在本地電腦部署。
一款由騰訊研究人員開發(fā)的音頻驅(qū)動的肖像動畫合成框架,AniPortrait能夠根據(jù)音頻和靜態(tài)人臉圖片生成逼真的動態(tài)視頻。AniPortrait官網(wǎng)入口網(wǎng)址
一個專注于動漫圖像超分辨率的項目,旨在恢復和增強來自現(xiàn)實世界場景的低質(zhì)量、低分辨率動漫圖像和視頻源。APISR官網(wǎng)入口網(wǎng)址
一種基于區(qū)域語義控制的實時交互生成圖像方法,主要用于圖像生成和編輯應(yīng)用。它基于擴散模型在文本到圖像合成中的成功,旨在通過減少推理時間和提高生成圖像的質(zhì)量來提高擴散模型的可用性。StreamMultiDiffusion官網(wǎng)入口網(wǎng)址
一款漂亮且功能強大的在線海報設(shè)計器,圖片編輯器,仿稿定設(shè)計,迅排設(shè)計Poster-Design適用于海報生成、電商產(chǎn)品圖、文章長圖、視頻/公眾號封面等多種場景。迅排設(shè)計官網(wǎng)入口網(wǎng)址
論文大師系統(tǒng)源碼,可SaaS租用或者源碼部署
一個開源的文本生成圖像動漫模型,通過整合新的數(shù)據(jù)集,Animagine XL 3.1擴展了對廣泛動漫作品和風格的理解,從經(jīng)典作品到最新發(fā)布的動漫,覆蓋了從古老到現(xiàn)代的各種藝術(shù)風格。Animagine XL 3.1官網(wǎng)入口網(wǎng)址
毫不費力地改變圖像和視頻中的照明,實現(xiàn)超逼真的效果。使用Beeble AI 的創(chuàng)新技術(shù),通過逼真的燈光效果增強您的創(chuàng)作。Beeble AI官網(wǎng)入口網(wǎng)址
一個可擴展、功能豐富且用戶友好的自托管 WebUI,適用于各種 LLM 運行器,支持的 LLM 運行器包括 Ollama 和 OpenAI 兼容的 API。Open WebUI官網(wǎng)入口網(wǎng)址
一個使用nextjs創(chuàng)建的用于生成 Sora AI視頻的開源Web模板。Sora.FM官網(wǎng)入口網(wǎng)址
一個開源項目,允許用戶使用 OpenAI Sora 模型使用文本在線生成視頻,從而簡化視頻創(chuàng)建,并具有輕松的一鍵網(wǎng)站部署功能。SoraWebui官網(wǎng)入口網(wǎng)址
一個高度可控的虛擬模特服裝試穿開源工具,OOTDiffusion可以根據(jù)不同性別和體型自動調(diào)整服裝,可控試穿參數(shù),自然融合與逼真效果。OOTDiffusion官網(wǎng)入口網(wǎng)址
一個能夠錄下你的語音內(nèi)容,然后自動幫助你把這些語音轉(zhuǎn)成文字,對內(nèi)容進行總結(jié),并且生成相關(guān)的任務(wù)列表的AI筆記工具。notesGPT官網(wǎng)入口網(wǎng)址
自動創(chuàng)建YouTube短視頻的自動化賺錢項目,只要輸入視頻文本MoneyPrinter即可自動產(chǎn)生與之相關(guān)的短視頻。MoneyPrinter官網(wǎng)入口網(wǎng)址
騰訊AI實驗室開發(fā)的一個實時目標檢測工具,它能夠自動識別和定位圖像中的各種對象,YOLO-World官網(wǎng)入口網(wǎng)址
一款由AI驅(qū)動的應(yīng)用程序,通過語音生成富有表現(xiàn)力的3D面部動畫。Audio2Face官網(wǎng)入口網(wǎng)址
一款革命性的語音面部動畫生成工具,借助 Media2Face,現(xiàn)在可以從任何音頻、圖像或文本輸入無縫生成逼真且富有表現(xiàn)力的面部動畫。Media2Face官網(wǎng)入口網(wǎng)址
一個基于WhisperLive把聲音轉(zhuǎn)文字和WhisperSpeech理解這些文字的能力構(gòu)建。能夠與AI聊天機器人進行超低延遲對話。WhisperFusion官網(wǎng)入口網(wǎng)址
一個視頻搜索和流媒體代理工具,能讓您在 ChatGPT 中與您的視頻庫聊天并觀看視頻流。StreamRAG官網(wǎng)入口網(wǎng)址
一個專門為DuckDB數(shù)據(jù)庫設(shè)計的文本到SQL的模型,你可以使用自然語言說描述你的需求,它會自動轉(zhuǎn)換成SQL代碼。DuckDB-NSQL官網(wǎng)入口網(wǎng)址
一種基于擴散的圖像修復模型,主要用于虛擬試穿場景。它能夠在修復圖像時保留參考物品的細節(jié),適用于在線購物等虛擬試穿場景中的圖像修復任務(wù)。Diffuse to Choose官網(wǎng)入口網(wǎng)址
基于大規(guī)模擴散的高保真通用圖像恢復模型,SupIR能夠根據(jù)文本提示進行智能修復,提高圖像修復的質(zhì)量和智能程度。SupIR官網(wǎng)入口網(wǎng)址
FunASR是一個基礎(chǔ)語音識別工具包,提供多種功能,包括語音識別(ASR)、語音端點檢測(VAD)、標點恢復、語言模型、說話人驗證、說話人分離和多人對話語音識別等。FunASR提供了便捷的腳本和教程,支持預訓練好的模型的推理與微調(diào),F(xiàn)unASR 基礎(chǔ)語音識別工具包官網(wǎng)入口網(wǎng)址
谷歌研究院開發(fā)的基于空間時間的文本到視頻擴散模型。采用了創(chuàng)新的空間時間U-Net架構(gòu),能夠一次性生成整個視頻的時間長度,確保了生成視頻的連貫性和逼真度。Lumiere官網(wǎng)入口網(wǎng)址
一個為黑白圖像上色的魔搭模型,通過雙解碼器實現(xiàn)逼真的圖像著色,輸入一張黑白圖像,實現(xiàn)端到端的全圖上色,返回上色處理后的彩色圖像。,DDColor官網(wǎng)入口網(wǎng)址
網(wǎng)易有道一個開源的本地知識庫問答系統(tǒng),旨在支持多種文件格式和數(shù)據(jù)庫,允許離線安裝和使用。,QAnything官網(wǎng)入口網(wǎng)址
字節(jié)跳動開發(fā)的由LLM驅(qū)動文本生成圖像多合一系統(tǒng),專門設(shè)計用于為不同的輸入提示生成高質(zhì)量的圖像。DiffusionGPT官網(wǎng)入口網(wǎng)址
一個聲音克隆和文本到語音轉(zhuǎn)換的開源 Python RAG框架,只需1分鐘語音即可訓練一個自己的TTS模型。GPT-SoVITS官網(wǎng)入口網(wǎng)址
一個增強版免費開源的ChatGPT程序,LibreChat 是一個免費開源的聊天機器人平臺,集成了多種 AI 模型。LibreChat官網(wǎng)入口網(wǎng)址
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙