AI項目和框架
HoloDreamer
HoloDreamer是北京大學聯合鵬城實驗室推出的AI文本驅動3D場景生成框架。通過兩個核心模塊:風格化全景圖生成和增強兩階段全景圖重建,從文本描述中快速生成沉...
Linly-Dubbing
Linly-Dubbing是一個開源的智能視頻多語言AI配音和翻譯工具,能自動將視頻內容翻譯成多種語言,并生成字幕。通過WhisperX和FunASR進行精準語音識別,基于Edge...
ControlNeXt
ControlNeXt是一種新型的AI圖像和視頻可控生成框架,由香港中文大學和商湯科技聯合開發。采用輕量化控制模塊和創新的交叉歸一化技術,大幅降低計算資源和訓練...
FancyVideo
FancyVideo是360聯合中山大學推出的AI文生視頻模型?;趧撔碌目鐜谋疽龑K(Cross-frame Textual Guidance Module, CTGM),能根據文本提示生成動態豐...
Glyph-ByT5
Glyph-ByT5-v2由微軟亞洲研究院、清華大學、北京大學和利物浦大學聯合開發的多語言視覺文本渲染項目。Glyph-ByT5-v2支持10種不同語言的準確視覺文本渲染,審...
Llama-3.1-Minitron
Llama-3.1-Minitron是由英偉達和Meta合作開發的AI模型,通過剪枝和知識蒸餾技術從Llama 3.1 8B模型精煉而成的更小型4B參數模型。這種優化減少了模型大小和復...
DeepSeek-Prover-V1.5
DeepSeek-Prover-V1.5是由DeepSeek團隊開發的開源數學大模型,擁有70億參數。模型通過結合強化學習(RLPAF)和蒙特卡洛樹搜索(特別是RMaxTS變體),在數學定...