AI項目和框架

首爾國立大學推出的單參考圖像生成多身份全身圖像技術

PersonaCraft是韓國首爾國立大學推出的個性化全身圖像合成技術,結合擴散模型和3D人類建模,能從單一參考圖像生成多個人物的逼真、個性化全身圖像。PersonaCr...
閱讀原文

GeneMAN:創新3D人體模型創建框架助力精準數字化人體重建

GeneMAN是上海AI實驗室、北京大學、南洋理工大學、上海交通大學聯合推出的3D人形創建框架,能從單張圖片中創建出高保真度的3D人體模型。框架不依賴于參數化人...
閱讀原文

MagicDriveDiT:高分辨率自動駕駛長視頻生成技術創新與應用

MagicDriveDiT是香港中文大學、香港科技大學、華為云和華為諾亞方舟實驗室共同推出基于DiT架構的新型視頻生成方法,專為自動駕駛應用設計,實現高分辨率和長...
閱讀原文

EfficientTAM:Meta AI推出創新視頻對象分割與跟蹤模型,提升視覺內容分析能力

EfficientTAM是Meta AI推出的輕量級視頻對象分割和跟蹤模型,能解決SAM 2模型在移動設備上部署時的高計算復雜度問題。基于用簡單的非層次化Vision Transforme...
閱讀原文

Amazon Nova:亞馬遜全新多模態生成大模型引領文本、圖像與視頻創作新時代

Amazon Nova 是亞馬遜云服務(AWS)推出的新一代AI基礎模型系列,提供行業領先的性能和成本效益。該系列包括專門處理文本的Amazon Nova Micro、多模態的Amazo...
閱讀原文

HunyuanVideo:騰訊發布130億參數開源視頻生成模型,賦能創作新紀元

HunyuanVideo是騰訊開源的視頻生成模型,擁有130億參數,是目前參數量最大的開源視頻模型之一。HunyuanVideo具備物理模擬、高文本語義還原度、動作一致性和電...
閱讀原文

Codel:多功能AI代理工具助力終端、瀏覽器及編輯器高效執行復雜任務

Codel是全自主AI代理工具,能在沙盒化的Docker環境中執行復雜任務和項目。Codel具備自主操作能力,內置瀏覽器和文本編輯器,所有操作記錄存儲于PostgreSQL數...
閱讀原文

Lobe Vidol:智能交互平臺讓你與虛擬人和3D模型實時對話探索新世界

Lobe Vidol是開源的數字人創作平臺,讓每個人都能輕松創建和互動自己的虛擬偶像。Lobe Vidol提供流暢的對話體驗、背景設置、動作姿勢庫、優雅的用戶界面、角...
閱讀原文

GPT學術優化:多功能開源項目助力學術研究與寫作的高效創新工具

GPT學術優化(GPT Academic)是功能豐富的開源項目,專為學術研究和寫作設計。GPT學術優化集成一鍵論文翻譯、源代碼解析、互聯網信息獲取、Latex文章校對、論...
閱讀原文

HiFiVFS:高保真視頻換臉技術引領視覺

HiFiVFS(High Fidelity Video Face Swapping)是騰訊和VIVO公司推出的高保真視頻換臉框架,HiFiVFS基于Stable Video Diffusion(SVD)框架,用多幀輸入和時...
閱讀原文

MVGenMaster:多視角融合的智能擴散模型提升數據分析與生成能力

MVGenMaster是復旦大學、阿里巴巴達摩院和湖潘實驗室共同推出的多視圖擴散模型,基于增強3D先驗處理多樣化的新視角合成(NVS)任務。模型基于度量深度和相機...
閱讀原文

360Zhinao2-7B:360智腦大模型升級版全面提升智能交互與數據處理能力

360Zhinao2-7B是360自研的AI大模型360智腦7B參數升級版,涵蓋基礎模型及多種上下文長度的聊天模型。360Zhinao2-7B模型是繼360Zhinao1-7B之后的重要更新,基于...
閱讀原文

Co-op Translator:開源多語言翻譯工具助力開發者輕松實現跨語言溝通

Co-op Translator是微軟推出的開源翻譯工具,基于Azure AI服務實現項目文檔和圖像中文本的自動化多語言翻譯。僅需一條命令,Co-op Translator能分析項目內容...
閱讀原文

AnchorCrafter:中科院與騰訊攜手打造智能虛擬主播實現高效帶貨新模式

AnchorCrafter是基于擴散模型的智能視頻制作系統,用在自動生成具有高保真度的主播風格產品推廣視頻。基于整合人-物交互(HOI)到姿態引導的人體視頻生成中,...
閱讀原文

MyTimeMachine:智能面部年齡轉換技術實現20至40年年齡跨度的個性化體驗

MyTimeMachine(MyTM)是先進的個性化面部年齡轉換技術,基于大約50張個人照片,跨越20至40年的時間跨度,訓練一個適配器網絡個性化預訓練的全局老化模型。My...
閱讀原文
19192939495146