亚洲成网777777国产精品,国产精品久久亚洲不卡动漫,亚洲.国产.欧美一区二区三区

BrushNet

BrushNet是由騰訊PCG部門的ARC實驗室與香港大學(xué)的研究人員推出的一個基于擴散模型的即插即用的圖像照片修復(fù)（Inpainting）模型，通過分解的雙分支架構(gòu)來有效...

11個月前

SUPIR

SUPIR是一個突破性的圖像修復(fù)和畫質(zhì)增強方法，利用了大規(guī)模的生成模型StableDiffusion-XL（SDXL）和模型擴展技術(shù)，通過深度學(xué)習(xí)和多模態(tài)方法，實現(xiàn)了對低質(zhì)量...

閱讀原文

AI工具

11個月前

StreamingT2V

StreamingT2V是由PicsArt AI研究團隊推出的一個文本到視頻的生成模型，旨在解決現(xiàn)有模型僅能生成16幀或24幀的高質(zhì)量短視頻，在生成長視頻時則會遇到如視頻質(zhì)...

閱讀原文

AI工具

11個月前

VoiceCraft

VoiceCraft是一個由德克薩斯大學(xué)奧斯汀分校研究團隊開源的神經(jīng)編解碼器語言模型，專注于零樣本語音編輯和文本到語音（TTS）任務(wù)。該模型采用Transformer架構(gòu)...

閱讀原文

AI工具

11個月前

Champ

Champ是由阿里巴巴、復(fù)旦大學(xué)和南京大學(xué)的研究人員共同提出的一種基于3D的將人物圖片轉(zhuǎn)換為視頻動畫的模型，該方法結(jié)合了3D參數(shù)化模型（特別是SMPL模型）和潛...

閱讀原文

AI工具

11個月前

Jamba

Jamba是由AI21 Labs推出的首個基于Mamba架構(gòu)的生產(chǎn)級別的大語言模型，目前大部分的大模型（如GPT、Gemini 和 Llama）都是基于 Transformer 結(jié)構(gòu)。而 Jamba 結(jié)...

閱讀原文

AI工具

11個月前

Voice Engine

Voice Engine是OpenAI最新推出的一項AI語音合成和聲音克隆技術(shù)，能夠利用簡短的15秒音頻樣本和文本輸入，生成接近原聲的自然聽起來的語音。該項技術(shù)自2022年...

閱讀原文

AI工具

11個月前

SWE-agent

SWE-agent是一個由普林斯頓大學(xué)NLP組研究人員開發(fā)的開源AI程序員和軟件工程師系統(tǒng)，利用大型語言模型（如GPT-4）的能力，可以自動解決GitHub存儲庫中的問題。...

閱讀原文

AI工具

11個月前

DreaMoving

DreaMoving是一個基于擴散模型的人類視頻生成框架，由阿里巴巴集團的研究團隊開發(fā)。DreaMoving通過視頻控制網(wǎng)絡(luò)和內(nèi)容引導(dǎo)器實現(xiàn)對人物動作和外觀的精確控制...

閱讀原文

AI工具

11個月前

AniPortrait

AniPortrait是一個由騰訊開源的照片對口型視頻生成框架，類似于此前阿里推出的EMO，能夠通過音頻和一張參考肖像圖片生成高質(zhì)量的動畫。

閱讀原文

AI工具

11個月前

InstantStyle

InstantStyle是小紅書的InstantX團隊開源的保留風(fēng)格一致性的個性化文本到圖像生成框架，旨在解決文本到圖像生成中的一個關(guān)鍵問題：如何在保持風(fēng)格一致性的同...

閱讀原文

AI工具

11個月前

DesignEdit

DesignEdit是由微軟亞洲研究院和北京大學(xué)的研究團隊共同開發(fā)的一個AI圖像編輯框架，引入了設(shè)計領(lǐng)域的圖層概念，采用多層潛在分解和融合的技術(shù)，實現(xiàn)了無需額...

閱讀原文

AI工具

11個月前

CodeGemma

CodeGemma是由Google發(fā)布的專注于代碼生成和理解的大型語言模型，該系列包含三種不同規(guī)模的模型，分別是2B預(yù)訓(xùn)練模型、7B預(yù)訓(xùn)練模型和7B指令微調(diào)模型，旨在提...

閱讀原文

AI工具

11個月前

Parler-TTS

Parler-TTS是由Hugging Face推出的一款開源的文本到語音（TTS）模型，能夠通過輸入提示描述模仿特定說話者的風(fēng)格（性別、音調(diào)、說話風(fēng)格等），生成高質(zhì)量、聽...

閱讀原文

AI工具

11個月前

VASA-1

VASA-1是由微軟亞洲研究院提出的一個將靜態(tài)照片轉(zhuǎn)換為對口型動態(tài)視頻的生成框架，能夠根據(jù)單張靜態(tài)人臉照片和一段語音音頻，實時生成逼真的3D說話面部動畫。

閱讀原文

AI工具

11個月前

1…191 192193194 195…270