<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        BrushNet

        BrushNet是由騰訊PCG部門的ARC實驗室與香港大學(xué)的研究人員推出的一個基于擴散模型的即插即用的圖像照片修復(fù)(Inpainting)模型,通過分解的雙分支架構(gòu)來有效...
        閱讀原文

        SUPIR

        SUPIR是一個突破性的圖像修復(fù)和畫質(zhì)增強方法,利用了大規(guī)模的生成模型StableDiffusion-XL(SDXL)和模型擴展技術(shù),通過深度學(xué)習(xí)和多模態(tài)方法,實現(xiàn)了對低質(zhì)量...
        閱讀原文

        StreamingT2V

        StreamingT2V是由PicsArt AI研究團隊推出的一個文本到視頻的生成模型,旨在解決現(xiàn)有模型僅能生成16幀或24幀的高質(zhì)量短視頻,在生成長視頻時則會遇到如視頻質(zhì)...
        閱讀原文

        VoiceCraft

        VoiceCraft是一個由德克薩斯大學(xué)奧斯汀分校研究團隊開源的神經(jīng)編解碼器語言模型,專注于零樣本語音編輯和文本到語音(TTS)任務(wù)。該模型采用Transformer架構(gòu)...
        閱讀原文

        Champ

        Champ是由阿里巴巴、復(fù)旦大學(xué)和南京大學(xué)的研究人員共同提出的一種基于3D的將人物圖片轉(zhuǎn)換為視頻動畫的模型,該方法結(jié)合了3D參數(shù)化模型(特別是SMPL模型)和潛...
        閱讀原文

        Jamba

        Jamba是由AI21 Labs推出的首個基于Mamba架構(gòu)的生產(chǎn)級別的大語言模型,目前大部分的大模型(如GPT、Gemini 和 Llama)都是基于 Transformer 結(jié)構(gòu)。而 Jamba 結(jié)...
        閱讀原文

        Voice Engine

        Voice Engine是OpenAI最新推出的一項AI語音合成和聲音克隆技術(shù),能夠利用簡短的15秒音頻樣本和文本輸入,生成接近原聲的自然聽起來的語音。該項技術(shù)自2022年...
        閱讀原文

        SWE-agent

        SWE-agent是一個由普林斯頓大學(xué)NLP組研究人員開發(fā)的開源AI程序員和軟件工程師系統(tǒng),利用大型語言模型(如GPT-4)的能力,可以自動解決GitHub存儲庫中的問題。...
        閱讀原文

        DreaMoving

        DreaMoving是一個基于擴散模型的人類視頻生成框架,由阿里巴巴集團的研究團隊開發(fā)。DreaMoving通過視頻控制網(wǎng)絡(luò)和內(nèi)容引導(dǎo)器實現(xiàn)對人物動作和外觀的精確控制...
        閱讀原文

        AniPortrait

        AniPortrait是一個由騰訊開源的照片對口型視頻生成框架,類似于此前阿里推出的EMO,能夠通過音頻和一張參考肖像圖片生成高質(zhì)量的動畫。
        閱讀原文

        InstantStyle

        InstantStyle是小紅書的InstantX團隊開源的保留風(fēng)格一致性的個性化文本到圖像生成框架,旨在解決文本到圖像生成中的一個關(guān)鍵問題:如何在保持風(fēng)格一致性的同...
        閱讀原文

        DesignEdit

        DesignEdit是由微軟亞洲研究院和北京大學(xué)的研究團隊共同開發(fā)的一個AI圖像編輯框架,引入了設(shè)計領(lǐng)域的圖層概念,采用多層潛在分解和融合的技術(shù),實現(xiàn)了無需額...
        閱讀原文

        CodeGemma

        CodeGemma是由Google發(fā)布的專注于代碼生成和理解的大型語言模型,該系列包含三種不同規(guī)模的模型,分別是2B預(yù)訓(xùn)練模型、7B預(yù)訓(xùn)練模型和7B指令微調(diào)模型,旨在提...
        閱讀原文

        Parler-TTS

        Parler-TTS是由Hugging Face推出的一款開源的文本到語音(TTS)模型,能夠通過輸入提示描述模仿特定說話者的風(fēng)格(性別、音調(diào)、說話風(fēng)格等),生成高質(zhì)量、聽...
        閱讀原文

        VASA-1

        VASA-1是由微軟亞洲研究院提出的一個將靜態(tài)照片轉(zhuǎn)換為對口型動態(tài)視頻的生成框架,能夠根據(jù)單張靜態(tài)人臉照片和一段語音音頻,實時生成逼真的3D說話面部動畫。
        閱讀原文
        主站蜘蛛池模板: 麻豆高清免费国产一区| 久久99毛片免费观看不卡| 在线免费观看国产| 亚洲VA中文字幕不卡无码| 日本激情猛烈在线看免费观看 | 青青免费在线视频| 日本特黄特色免费大片| 亚洲国产成人AV网站| 国产v片免费播放| 免费中文字幕视频| 亚洲一区二区女搞男| 暖暖日本免费中文字幕| 亚洲国产二区三区久久| 1000部夫妻午夜免费| 亚洲一区二区三区91| 免费无码又爽又高潮视频| 污视频网站在线免费看| 在线a亚洲v天堂网2019无码| 中文字幕免费不卡二区| 亚洲福利一区二区| 妞干网在线免费视频| 精品在线免费视频| 亚洲午夜久久久久妓女影院| 国产精品区免费视频| 亚洲AV无码一区二区三区在线| 成年女人18级毛片毛片免费 | 成人妇女免费播放久久久| 亚洲AV中文无码乱人伦下载| 最近免费2019中文字幕大全| 亚洲 欧洲 自拍 另类 校园| 免费一看一级毛片人| 免费a级毛片无码a∨免费软件| 99ri精品国产亚洲| 在线观看免费亚洲| a级成人免费毛片完整版| 亚洲伊人久久大香线蕉影院| 免费在线观看理论片| 久久青草国产免费观看| 亚洲国产精品日韩av不卡在线| 亚洲精品国产综合久久一线| 在线美女免费观看网站h|