AI項目和框架

EfficientTAM:Meta AI推出創新視頻對象分割與跟蹤模型,提升視覺內容分析能力

EfficientTAM是Meta AI推出的輕量級視頻對象分割和跟蹤模型,能解決SAM 2模型在移動設備上部署時的高計算復雜度問題。基于用簡單的非層次化Vision Transforme...
閱讀原文

Amazon Nova:亞馬遜全新多模態生成大模型引領文本、圖像與視頻創作新時代

Amazon Nova 是亞馬遜云服務(AWS)推出的新一代AI基礎模型系列,提供行業領先的性能和成本效益。該系列包括專門處理文本的Amazon Nova Micro、多模態的Amazo...
閱讀原文

HunyuanVideo:騰訊發布130億參數開源視頻生成模型,賦能創作新紀元

HunyuanVideo是騰訊開源的視頻生成模型,擁有130億參數,是目前參數量最大的開源視頻模型之一。HunyuanVideo具備物理模擬、高文本語義還原度、動作一致性和電...
閱讀原文

Codel:多功能AI代理工具助力終端、瀏覽器及編輯器高效執行復雜任務

Codel是全自主AI代理工具,能在沙盒化的Docker環境中執行復雜任務和項目。Codel具備自主操作能力,內置瀏覽器和文本編輯器,所有操作記錄存儲于PostgreSQL數...
閱讀原文

Lobe Vidol:智能交互平臺讓你與虛擬人和3D模型實時對話探索新世界

Lobe Vidol是開源的數字人創作平臺,讓每個人都能輕松創建和互動自己的虛擬偶像。Lobe Vidol提供流暢的對話體驗、背景設置、動作姿勢庫、優雅的用戶界面、角...
閱讀原文

GPT學術優化:多功能開源項目助力學術研究與寫作的高效創新工具

GPT學術優化(GPT Academic)是功能豐富的開源項目,專為學術研究和寫作設計。GPT學術優化集成一鍵論文翻譯、源代碼解析、互聯網信息獲取、Latex文章校對、論...
閱讀原文

HiFiVFS:高保真視頻換臉技術引領視覺

HiFiVFS(High Fidelity Video Face Swapping)是騰訊和VIVO公司推出的高保真視頻換臉框架,HiFiVFS基于Stable Video Diffusion(SVD)框架,用多幀輸入和時...
閱讀原文

MVGenMaster:多視角融合的智能擴散模型提升數據分析與生成能力

MVGenMaster是復旦大學、阿里巴巴達摩院和湖潘實驗室共同推出的多視圖擴散模型,基于增強3D先驗處理多樣化的新視角合成(NVS)任務。模型基于度量深度和相機...
閱讀原文

360Zhinao2-7B:360智腦大模型升級版全面提升智能交互與數據處理能力

360Zhinao2-7B是360自研的AI大模型360智腦7B參數升級版,涵蓋基礎模型及多種上下文長度的聊天模型。360Zhinao2-7B模型是繼360Zhinao1-7B之后的重要更新,基于...
閱讀原文

Co-op Translator:開源多語言翻譯工具助力開發者輕松實現跨語言溝通

Co-op Translator是微軟推出的開源翻譯工具,基于Azure AI服務實現項目文檔和圖像中文本的自動化多語言翻譯。僅需一條命令,Co-op Translator能分析項目內容...
閱讀原文

AnchorCrafter:中科院與騰訊攜手打造智能虛擬主播實現高效帶貨新模式

AnchorCrafter是基于擴散模型的智能視頻制作系統,用在自動生成具有高保真度的主播風格產品推廣視頻。基于整合人-物交互(HOI)到姿態引導的人體視頻生成中,...
閱讀原文

MyTimeMachine:智能面部年齡轉換技術實現20至40年年齡跨度的個性化體驗

MyTimeMachine(MyTM)是先進的個性化面部年齡轉換技術,基于大約50張個人照片,跨越20至40年的時間跨度,訓練一個適配器網絡個性化預訓練的全局老化模型。My...
閱讀原文

MultiFoley:創新音效生成系統助力創作者實現無限靈感

MultiFoley是Adobe Research和密歇根大學共同推出的音效生成系統,能基于文本、音頻和視頻的多模態控制生成Foley聲音效果。系統支持用戶根據文本提示、參考音...
閱讀原文

CAT4D:基于單目視頻技術的創新4D場景生成方法解析

CAT4D是Google DeepMind、哥倫比亞大學和加州大學圣地亞哥分校共同推出的,能從單目視頻創建4D場景(動態3D)表示。CAT4D基于多視圖視頻擴散模型,能在任意指...
閱讀原文

Make-It-Animatable:中科大與騰訊聯手打造智能即時動畫生成資產系統

Make-It-Animatable是中國科學技術大學和Tencent PCG推出的數據驅動框架,能在不到一秒鐘內讓任何3D人形模型準備好進行角色動畫狀態,無論其形狀和姿勢如何。...
閱讀原文