AI項目和框架

因賽AIGC

因賽AIGC是因賽集團推出的AI營銷工具,InsightGPT結合AI技術與營銷策略洞察、內容創意生產、傳播投放及效果轉化,提升營銷行業的生產力。InsightGPT不僅具備...
閱讀原文

Transfusion

Transfusion是Meta公司最新推出的文本與圖像融合的多模態AI模型,Transfusion通過結合語言模型的下一個token預測和擴散模型,在單一變換器上處理混合模態數據...
閱讀原文

RAGFlow

RAGFlow 是開源的 RAG(Retrieval-Augmented Generation)引擎,擁有深入理解文檔并增強生成能力,是基于OCR和文檔解析的下一代 RAG 引擎。RAGFlow通過集成自...
閱讀原文

StyleShot

StyleShot 是開源的AI圖像風格遷移模型,無需額外訓練即可實現任意風格到任意內容的遷移。通過風格感知編碼器提取風格特征,基于內容融合編碼器加強風格與內...
閱讀原文

IMAGDressing

IMAGDressing是華為聯合騰訊推出的AI換衣工具,IMAGDressing支持用戶通過模塊化的方式生成服裝,并在虛擬環境中進行試穿。項目頁面提供了自動化工作流程、代...
閱讀原文

NextChat

NextChat是一個基于 Next.js 和 Vercel 的開源項目,支持用戶將 ChatGPT 等 AI 大模型集成到自己的網頁應用中。NextChat不僅提供了現成的代碼庫,還支持一鍵...
閱讀原文

DistriFusion

DistriFusion是高分辨率擴散模型的分布式并行推理框架,通過分布式并行推理顯著加速了擴散模型在多個GPU上生成高分辨率圖像的過程。DistriFusion利用patch pa...
閱讀原文

Still-Moving

Still-Moving是DeepMind推出的AI視頻生成框架,支持用戶定制文本到視頻(T2V)模型,無需特定視頻數據。通過訓練輕量級的空間適配器,Still-Moving能在靜止圖像...
閱讀原文

AutoShorts

AutoShorts是開源的AI視頻創作和發布平臺,使用AI技術一鍵生成并定制無臉視頻。AutoShorts支持自定義腳本、配音和視覺效果,每天自動發布新視頻到YouTube和Ti...
閱讀原文

HeadGAP

HeadGAP是字節跳動和上海科技大學共同推出的3D頭像生成模型,僅用少量圖片快速生成逼真的3D頭像。采用先驗學習和個性化創建階段的框架,基于大規模多視角動態...
閱讀原文

LMMs-Eval

LMMs-Eval 是一個專為多模態AI模型設計的統一評估框架,提供標準化、廣泛覆蓋且成本效益高的模型性能評估解決方案。包含超過50個任務和10多個模型,通過透明...
閱讀原文

MooER

MooER是摩爾線程推出的業界首個基于國產全功能GPU訓練的開源音頻理解大模型。不僅能進行中文和英文的語音識別,還具備中譯英的語音翻譯能力。
閱讀原文

StockBot

StockBot 是一個基于Llama3的AI金融Agent,提供實時股票信息、財務數據、新聞和互動圖表。支持多資產市場,包括股票、外匯、債券和加密貨幣。用戶可通過自然...
閱讀原文

Imagine Yourself

Imagine Yourself 是Meta公司推出的個性化AI圖像生成模型,突破了傳統方法的局限,無需對每個用戶進行單獨調整,通過單一模式即可滿足不同用戶需求。模型采用...
閱讀原文

Bark

Bark是Suno AI 推出的開源文本到音頻模型,能生成逼真的多語言語音和多種音頻類型,包括音樂、背景噪音等,同時支持非語言交流如笑聲和哭泣。Bark提供預訓練...
閱讀原文