<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        B站輕量級大語言模型index-1.9B深入解析

        AIGC動態(tài)9個月前發(fā)布 智猩猩AGI
        418 0 0

        B站輕量級大語言模型index-1.9B深入解析

        AIGC動態(tài)歡迎閱讀

        原標題:B站輕量級大語言模型index-1.9B深入解析
        關鍵字:數(shù)據(jù),模型,階段,效果,指令
        文章來源:智猩猩AGI
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        直播預告 |「智猩猩AIGC視頻生成公開課 魔琺科技專場」正式開講啦~8月13日晚7點開講,魔琺科技市場負責人李韻將直播講解《AIGC時代,企業(yè)級視頻生成的挑戰(zhàn)與實踐》,內(nèi)容涵蓋一站式3D視頻創(chuàng)作平臺與行業(yè)應用、從0到1,生成一個視頻產(chǎn)品演示,歡迎掃名~bilibili發(fā)布的Index-1.9B包含:
        Index-1.9B base:在2.8T語料訓練的基模型
        Index-1.9B pure:部分數(shù)據(jù)和base不同,其他相同
        Index-1.9B chat:基于base進行SFT和DPO后的模型
        Index-1.9B character:在chat的基礎上用RAG+fewshots提供角色扮演的能力
        下面看下細節(jié)。
        01模型(1)模型深度
        目前業(yè)界普遍的認知是模型深度比寬度對效果的影響更大(相同參數(shù)下)。對比層數(shù)分別為36層和9層,總參數(shù)都為1.01B的模型,結果如下圖,36層模型(base)效果確實更好。需要注意的是,相同模型參數(shù)量下,層數(shù)更多的模型會有更多的activation(與L * hidden size成正比),因此會需要更多顯存。
        (2)Norm-Head
        模型不同層


        原文鏈接:B站輕量級大語言模型index-1.9B深入解析

        聯(lián)系作者

        文章來源:智猩猩AGI
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網(wǎng)

        相關文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 无码精品国产一区二区三区免费| 亚洲国产精品成人午夜在线观看| 国产亚洲情侣久久精品| 成年女人午夜毛片免费视频| 亚洲精品在线不卡| 99久久免费观看| 亚洲视屏在线观看| www视频免费看| 亚洲国产午夜电影在线入口| 成人无码区免费A片视频WWW| 亚洲一区二区三区不卡在线播放| 免费看成人AA片无码视频羞羞网| 亚洲av成人综合网| 色吊丝永久在线观看最新免费| 性色av极品无码专区亚洲| 国产精品免费小视频| 乱淫片免费影院观看| 国产精品亚洲综合专区片高清久久久| 国产精品无码永久免费888| 在线亚洲97se亚洲综合在线| 人人揉揉香蕉大免费不卡| 伊人久久综在合线亚洲2019| 成人AV免费网址在线观看| 亚洲精品无码aⅴ中文字幕蜜桃| 免费v片视频在线观看视频| 国产精品1024在线永久免费 | 亚洲国产精品一区二区三区久久| 一级女人18片毛片免费视频| 亚洲AV成人一区二区三区AV| 黄页网站免费观看| 人人爽人人爽人人片A免费| 久久青草亚洲AV无码麻豆| 四虎永久在线观看免费网站网址 | 全部免费毛片在线播放| 亚洲人和日本人jizz| 国产美女精品久久久久久久免费 | 亚洲综合av一区二区三区| 九月婷婷亚洲综合在线| 日韩免费高清大片在线| 亚洲精品第一国产综合亚AV| 91麻豆精品国产自产在线观看亚洲|