AI項目和框架

EfficientTAM：Meta AI推出創新視頻對象分割與跟蹤模型，提升視覺內容分析能力

EfficientTAM是Meta AI推出的輕量級視頻對象分割和跟蹤模型，能解決SAM 2模型在移動設備上部署時的高計算復雜度問題。基于用簡單的非層次化Vision Transforme...

閱讀原文

AI工具

12個月前

Amazon Nova：亞馬遜全新多模態生成大模型引領文本、圖像與視頻創作新時代

Amazon Nova 是亞馬遜云服務（AWS）推出的新一代AI基礎模型系列，提供行業領先的性能和成本效益。該系列包括專門處理文本的Amazon Nova Micro、多模態的Amazo...

閱讀原文

AI工具

12個月前

HunyuanVideo：騰訊發布130億參數開源視頻生成模型，賦能創作新紀元

HunyuanVideo是騰訊開源的視頻生成模型，擁有130億參數，是目前參數量最大的開源視頻模型之一。HunyuanVideo具備物理模擬、高文本語義還原度、動作一致性和電...

閱讀原文

AI工具

12個月前

Codel：多功能AI代理工具助力終端、瀏覽器及編輯器高效執行復雜任務

Codel是全自主AI代理工具，能在沙盒化的Docker環境中執行復雜任務和項目。Codel具備自主操作能力，內置瀏覽器和文本編輯器，所有操作記錄存儲于PostgreSQL數...

閱讀原文

AI工具

12個月前

Lobe Vidol：智能交互平臺讓你與虛擬人和3D模型實時對話探索新世界

Lobe Vidol是開源的數字人創作平臺，讓每個人都能輕松創建和互動自己的虛擬偶像。Lobe Vidol提供流暢的對話體驗、背景設置、動作姿勢庫、優雅的用戶界面、角...

閱讀原文

AI工具

12個月前

GPT學術優化：多功能開源項目助力學術研究與寫作的高效創新工具

GPT學術優化（GPT Academic）是功能豐富的開源項目，專為學術研究和寫作設計。GPT學術優化集成一鍵論文翻譯、源代碼解析、互聯網信息獲取、Latex文章校對、論...

閱讀原文

AI工具

12個月前

HiFiVFS：高保真視頻換臉技術引領視覺

HiFiVFS（High Fidelity Video Face Swapping）是騰訊和VIVO公司推出的高保真視頻換臉框架，HiFiVFS基于Stable Video Diffusion（SVD）框架，用多幀輸入和時...

閱讀原文

AI工具

12個月前

MVGenMaster：多視角融合的智能擴散模型提升數據分析與生成能力

MVGenMaster是復旦大學、阿里巴巴達摩院和湖潘實驗室共同推出的多視圖擴散模型，基于增強3D先驗處理多樣化的新視角合成（NVS）任務。模型基于度量深度和相機...

閱讀原文

AI工具

12個月前

360Zhinao2-7B：360智腦大模型升級版全面提升智能交互與數據處理能力

360Zhinao2-7B是360自研的AI大模型360智腦7B參數升級版，涵蓋基礎模型及多種上下文長度的聊天模型。360Zhinao2-7B模型是繼360Zhinao1-7B之后的重要更新，基于...

閱讀原文

AI工具

12個月前

Co-op Translator：開源多語言翻譯工具助力開發者輕松實現跨語言溝通

Co-op Translator是微軟推出的開源翻譯工具，基于Azure AI服務實現項目文檔和圖像中文本的自動化多語言翻譯。僅需一條命令，Co-op Translator能分析項目內容...

閱讀原文

AI工具

12個月前

AnchorCrafter：中科院與騰訊攜手打造智能虛擬主播實現高效帶貨新模式

AnchorCrafter是基于擴散模型的智能視頻制作系統，用在自動生成具有高保真度的主播風格產品推廣視頻。基于整合人-物交互（HOI）到姿態引導的人體視頻生成中，...

閱讀原文

AI工具

12個月前

MyTimeMachine：智能面部年齡轉換技術實現20至40年年齡跨度的個性化體驗

MyTimeMachine（MyTM）是先進的個性化面部年齡轉換技術，基于大約50張個人照片，跨越20至40年的時間跨度，訓練一個適配器網絡個性化預訓練的全局老化模型。My...

閱讀原文

AI工具

12個月前

MultiFoley：創新音效生成系統助力創作者實現無限靈感

MultiFoley是Adobe Research和密歇根大學共同推出的音效生成系統，能基于文本、音頻和視頻的多模態控制生成Foley聲音效果。系統支持用戶根據文本提示、參考音...

閱讀原文

AI工具

12個月前

CAT4D：基于單目視頻技術的創新4D場景生成方法解析

CAT4D是Google DeepMind、哥倫比亞大學和加州大學圣地亞哥分校共同推出的，能從單目視頻創建4D場景（動態3D）表示。CAT4D基于多視圖視頻擴散模型，能在任意指...

閱讀原文

AI工具

12個月前

Make-It-Animatable：中科大與騰訊聯手打造智能即時動畫生成資產系統

Make-It-Animatable是中國科學技術大學和Tencent PCG推出的數據驅動框架，能在不到一秒鐘內讓任何3D人形模型準備好進行角色動畫狀態，無論其形狀和姿勢如何。...

閱讀原文

AI工具

12個月前

1…101 102103104 105…156