AI項目和框架
GPT-SoVITS
GPT-SoVITS是一個開源的聲音克隆項目,該語音合成工具結合了GPT模型和SoVITS變聲器技術,僅需通過少量的樣本數據實現高質量的語音克隆和文本到語音轉換。該工...
OpenCodeInterpreter
OpenCodeInterpreter是一個開源的代碼解釋器系統,旨在通過利用大模型結合代碼生成、執行和迭代精煉的能力,可以輔助開發者在軟件開發過程中生成、測試和優化...
ChatMusician
ChatMusician是由Multimodal Art Projection Research Community、Skywork AI和香港科技大學的研究人員推出的,一個開源的用于理解和生成音樂的大型語言模型...
StarCoder 2
StarCoder 2是由BigCode項目團隊開發的新一代大型代碼語言模型,旨在為代碼生成、編輯和推理任務提供強大的支持。該系列模型在前一代StarCoder模型的基礎上進...
Snap Video
Snap Video是由Snap公司的研究團隊開發的一個AI視頻生成模型,目標是通過文本描述來合成視頻,即用戶可以輸入一段描述性的文本,模型能夠根據這段文本生成相...
LayerDiffusion
LayerDiffusion是由來自斯坦福大學的研究人員提出的一種利用大規模預訓練的潛在擴散模型生成透明圖像的技術,可以幫助用戶生成單個透明圖像或多個透明圖層。...
TextDiffuser-2
Text-Diffuser 2是由來自微軟研究院、香港科技大學和中山大學的研究人員最新推出的一個基于擴散模型的文本渲染方法,旨在解決圖像擴散模型生成文字時在靈活性...
ResAdapter
ResAdapter是由字節跳動的研究人員推出的一種為擴散模型(如Stable Diffusion)設計的分辨率適配器,允許這些圖像生成模型生成具有任意分辨率和寬高比的圖像...
粵公網安備 44011502001135號