OpenCodeInterpreter
OpenCodeInterpreter是一個(gè)開源的代碼解釋器系統(tǒng),旨在通過利用大模型結(jié)合代碼生成、執(zhí)行和迭代精煉的能力,可以輔助開發(fā)者在軟件開發(fā)過程中生成、測試和優(yōu)化...
ChatMusician
ChatMusician是由Multimodal Art Projection Research Community、Skywork AI和香港科技大學(xué)的研究人員推出的,一個(gè)開源的用于理解和生成音樂的大型語言模型...
StarCoder 2
StarCoder 2是由BigCode項(xiàng)目團(tuán)隊(duì)開發(fā)的新一代大型代碼語言模型,旨在為代碼生成、編輯和推理任務(wù)提供強(qiáng)大的支持。該系列模型在前一代StarCoder模型的基礎(chǔ)上進(jìn)...
Snap Video
Snap Video是由Snap公司的研究團(tuán)隊(duì)開發(fā)的一個(gè)AI視頻生成模型,目標(biāo)是通過文本描述來合成視頻,即用戶可以輸入一段描述性的文本,模型能夠根據(jù)這段文本生成相...
LayerDiffusion
LayerDiffusion是由來自斯坦福大學(xué)的研究人員提出的一種利用大規(guī)模預(yù)訓(xùn)練的潛在擴(kuò)散模型生成透明圖像的技術(shù),可以幫助用戶生成單個(gè)透明圖像或多個(gè)透明圖層。...
TextDiffuser-2
Text-Diffuser 2是由來自微軟研究院、香港科技大學(xué)和中山大學(xué)的研究人員最新推出的一個(gè)基于擴(kuò)散模型的文本渲染方法,旨在解決圖像擴(kuò)散模型生成文字時(shí)在靈活性...
ResAdapter
ResAdapter是由字節(jié)跳動(dòng)的研究人員推出的一種為擴(kuò)散模型(如Stable Diffusion)設(shè)計(jì)的分辨率適配器,允許這些圖像生成模型生成具有任意分辨率和寬高比的圖像...
AtomoVideo
AtomoVideo是由阿里巴巴的研究團(tuán)隊(duì)提出的一個(gè)高保真圖像到視頻(I2V)生成框架,旨在從輸入的靜態(tài)圖像生成高質(zhì)量的視頻內(nèi)容。該框架能夠保持生成視頻與給定參...