AI項目和框架

FaceChain

FaceChain是阿里巴巴達摩院推出的一個開源的人物寫真和個人數字形象的AI生成框架(類似于免費開源版的妙鴨相機),用戶僅需要提供最少一張照片即可生成獨屬于...
閱讀原文

Motionshop

Motionshop是阿里巴巴智能計算研究院推出的一個AI角色動畫框架,可將視頻中的人物角色替換為3D化身,同時不改變視頻中的其他場景和人物。該框架利用視頻處理...
閱讀原文

AnyText

AnyText是阿里巴巴智能計算研究院的團隊推出的一個基于擴散的多語言視覺文本生成和編輯模型,專注于在圖像中渲染準確和連貫的文本。AnyText包括兩個主要元素...
閱讀原文

InstantID

InstantID是一種基于擴散模型的圖像生成技術,它專注于實現零次(zero-shot)身份保留(Identity-Preserving)的個性化圖像合成。這項技術允許用戶僅使用一張...
閱讀原文

VideoCrafter2

VideoCrafter2是一個由騰訊AI實驗室開發的視頻生成模型,旨在克服高質量視頻數據獲取的局限性,訓練出能夠生成高質量視頻的模型。該模型的核心思想是將視頻的...
閱讀原文

Screenshot to Code

Sscreenshot to Code是一個開源的項目,利用人工智能技術(GPT-4V 和 DALL·E 3)將用戶的屏幕截圖轉換為前端網頁代碼。項目的核心功能是自動化網頁設計的編碼...
閱讀原文

DDColor

DDColor是阿里達摩院的研究人員推出的一個開源的AI圖像著色框架,可以一鍵將黑白圖片上色變為全彩圖像。該方法通過使用雙解碼器架構(像素解碼器和顏色解碼器...
閱讀原文

DemoFusion

DemoFusion是一個旨在低成本進行高分辨率圖像生成的技術框架,通過擴展現有的開源生成人工智能模型(如Stable Diffusion),使得這些模型能夠在不進行額外訓...
閱讀原文

ActAnywhere

ActAnywhere是一個由斯坦福大學和Adobe Research的研究人員共同開發的視頻生成模型,旨在解決視頻背景生成的問題,特別是在需要將前景主體(如人物)與新背景...
閱讀原文

Lepton Search

Lepton Search是由原阿里巴巴技術副總裁和AI科學家賈揚清創辦的Lepton AI應用構建平臺開源的一個對話式AI搜素引擎,該項目基于調用Lepton平臺上的云端人工智...
閱讀原文

Follow Your Pose

Follow Your Pose是由清華大學、香港科技大學、騰訊AI Lab以及中科院的研究人員開源的一個基于文本到視頻生成的框架,允許用戶通過文本描述和指定的人物姿態...
閱讀原文

IP-Adapter

IP-Adapter(Image Prompt Adapter)是一種專門為預訓練的文本到圖像擴散模型(如Stable Diffusion)設計的適配器,目的是讓文生圖模型能夠利用圖像提示來生...
閱讀原文

OLMo

OLMo(Open Language Model)是由Allen AI(AI2,艾倫AI研究所)開發的一個完全開源開放的大型語言模型(LLM)框架,設計初衷是為了通過開放研究,促進學術界...
閱讀原文

DiffusionGPT

DiffusionGPT是由來自字節跳動與中山大學的研究人員推出的一個開源的大模型(LLM)驅動的文本到圖像生成系統,旨在解決文生圖領域無法處理不同的輸入或者僅限...
閱讀原文

MetaGPT

MetaGPT是一個創新的元編程框架,結合了大語言模型和多智能體協作系統,旨在通過模擬人類工作流程來解決復雜問題。該框架的核心在于將標準化操作程序(SOPs)...
閱讀原文