<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        探索LLM與擴(kuò)散模型的結(jié)合:未來(lái)多模態(tài)大模型的無(wú)限可能性

        AIGC動(dòng)態(tài)6個(gè)月前發(fā)布 智猩猩GenAI
        204 0 0

        大規(guī)模多模態(tài)模型訓(xùn)練細(xì)節(jié)~

        探索LLM與擴(kuò)散模型的結(jié)合:未來(lái)多模態(tài)大模型的無(wú)限可能性

        原標(biāo)題:LLM+Diffusion方案是否值得持續(xù)投入?生成+理解一體多模態(tài)大模型的思考
        文章來(lái)源:智猩猩GenAI
        內(nèi)容字?jǐn)?shù):2816字

        2024中國(guó)生成式AI大會(huì)(上海站)預(yù)告

        根據(jù)大會(huì)預(yù)告,2024中國(guó)生成式AI大會(huì)將于12月5日至6日在上海舉辦。本次大會(huì)由智猩猩共同主辦,許多知名嘉賓已確認(rèn)參會(huì)演講,包括北大(臨港)大模型對(duì)齊中心執(zhí)行主任徐驊,騰訊優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳賢等30+位專(zhuān)家。歡迎感興趣的朋友報(bào)名參加。

        多模態(tài)大模型方案概述

        當(dāng)前的多模態(tài)大模型主要分為以下幾種方案:

        1. 以語(yǔ)言模型為核心:
          • Emu3:支持視頻、圖像和文本任務(wù),采用純自回歸(AR)損失。
          • Chameleon:專(zhuān)注于圖像和文本任務(wù),同樣使用純AR損失。
          • Show-o:圖像部分使用雙向注意力,文字部分為AR損失。
          • Janus:結(jié)合兩種視覺(jué)編碼器,文本和圖像均為純AR損失。
        2. 語(yǔ)言模型+擴(kuò)散模型:
          • TransFusion:文字部分使用AR損失,圖像部分使用DDPM損失。
          • JanusFlow:文字部分AR損失,圖像部分使用RF損失。

        共性結(jié)論與未來(lái)方向

        不同方案的共性結(jié)論如下:

        1. 以LLM為核心的架構(gòu)在訓(xùn)練和推理階段易于擴(kuò)展,但效果尚未達(dá)到頂尖水平。
        2. 在模型尺寸相當(dāng)?shù)那闆r下,加入擴(kuò)散模型的視覺(jué)生成效果優(yōu)于純LLM架構(gòu)。
        3. 視覺(jué)編碼器的發(fā)展仍然主要分為理解與生成兩類(lèi),且在各自任務(wù)上表現(xiàn)優(yōu)異。

        大規(guī)模多模態(tài)模型的訓(xùn)練細(xì)節(jié)

        關(guān)于大規(guī)模多模態(tài)模型的訓(xùn)練,以下是一些關(guān)鍵細(xì)節(jié):

        1. Chameleon在從零開(kāi)始訓(xùn)練中分享了多項(xiàng)穩(wěn)定。
        2. Emu3分享了預(yù)訓(xùn)練、后訓(xùn)練及DPO的一些細(xì)節(jié)。
        3. Janus系列文章探討了訓(xùn)練框架和效率提升的方法。

        未來(lái)研究方向

        未來(lái)的研究方向包括:

        1. 如何統(tǒng)一生成與理解的視覺(jué)編碼器,并在大規(guī)模多模態(tài)模型上實(shí)現(xiàn)有效應(yīng)用。
        2. 視覺(jué)生成與理解任務(wù)在基礎(chǔ)模型層面如何統(tǒng)一,以及相應(yīng)的代理任務(wù)和損失設(shè)計(jì)。
        3. LLM與擴(kuò)散模型結(jié)合的長(zhǎng)期投資價(jià)值,尤其是在解決誤差累積問(wèn)題上。

        總結(jié)來(lái)看,2024中國(guó)生成式AI大會(huì)將為與會(huì)者提供豐富的技術(shù)共享與討論平臺(tái),期待更多研究者和技術(shù)人員的參與與交流。


        聯(lián)系作者

        文章來(lái)源:智猩猩GenAI
        作者微信:
        作者簡(jiǎn)介:智猩猩旗下矩陣賬號(hào)之一,聚焦大模型開(kāi)啟的通用人工智能浪潮。

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無(wú)評(píng)論

        暫無(wú)評(píng)論...
        主站蜘蛛池模板: 成人免费的性色视频| 日韩一区二区三区免费播放| 久久亚洲私人国产精品| 亚洲国产日韩在线视频| 亚洲精品无码不卡在线播HE| 亚洲色欲久久久综合网| 国产亚洲成av片在线观看| 亚洲AV无一区二区三区久久| 亚洲av无码专区在线播放| 亚洲自偷精品视频自拍| 亚洲国产精品yw在线观看| 亚洲精品福利你懂| 亚洲一区二区三区高清在线观看| 亚洲熟妇自偷自拍另欧美| 亚洲精品国产精品| 成人福利在线观看免费视频| 成年免费a级毛片免费看无码| 中文字幕无码免费久久| 精品无码人妻一区二区免费蜜桃 | 精品亚洲成a人在线观看| 羞羞网站免费观看| 成人免费一区二区三区| 99久久99热精品免费观看国产| 50岁老女人的毛片免费观看| 无码一区二区三区免费视频| 国产精品99久久免费| 久久国产成人精品国产成人亚洲| 国产A在亚洲线播放| 亚洲一区在线视频| 大桥未久亚洲无av码在线| fc2成年免费共享视频网站| 国产一区二区免费视频| 黄页网站在线看免费| 亚洲?V乱码久久精品蜜桃| 久久国产亚洲精品麻豆| 亚洲免费在线视频播放| 美女黄频a美女大全免费皮| 国产日韩一区二区三免费高清| 69天堂人成无码麻豆免费视频| 四虎影视永久免费观看网址| 日韩va亚洲va欧洲va国产|