<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        小模型性能飽和、表現不佳,根源是因為Softmax?

        AIGC動態1年前 (2024)發布 機器之心
        466 0 0

        小模型性能飽和、表現不佳,根源是因為Softmax?

        AIGC動態歡迎閱讀

        原標題:小模型性能飽和、表現不佳,根源是因為Softmax?
        關鍵字:模型,維度,表征,各向異性,語言
        文章來源:機器之心
        內容字數:7685字

        內容摘要:


        機器之心報道
        編輯:陳萍小語言模型的出現是為彌補大語言模型的訓練、推理等成本昂貴的缺點,但其自身也存在訓練到某個階段后性能下降的事實 (飽和現象),那么這個現象的原因是什么?是否可以克服并利用它去提升小語言模型的性能?語言建模領域的最新進展在于在極大規模的網絡文本語料庫上預訓練高參數化的神經網絡。在實踐中,使用這樣的模型進行訓練和推斷可能會成本高昂,這促使人們使用較小的替代模型。然而,已經觀察到較小的模型可能會出現飽和現象,表現為在訓練的某個高級階段性能下降并趨于穩定。
        最近的一篇論文發現,這種飽和現象可以通過較小模型的隱藏維度與目標上下文概率分布的高秩之間的不匹配來解釋。這種不匹配通過著名的 softmax 瓶頸現象影響了這些模型中使用的線性預測頭的性能。論文鏈接:https://arxiv.org/pdf/2404.07647.pdf
        本文在不同設置下衡量了 softmax 瓶頸的影響,并發現基于小于 1000 個隱藏維度的模型往往在預訓練的后期采用退化的潛在表征,從而導致評估性能降低。
        簡介
        表征退化問題是影響用于文本數據的自監督學習方法等多種模態的常見現象。對語言模型的中間表征


        原文鏈接:小模型性能飽和、表現不佳,根源是因為Softmax?

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产人成亚洲第一网站在线播放| 亚洲精品午夜国产VA久久成人| 亚洲国产成人精品无码一区二区| 无码午夜成人1000部免费视频| 亚洲AV无码一区东京热| 拍拍拍无挡免费视频网站| 亚洲国产精品一区二区成人片国内 | 伊伊人成亚洲综合人网7777| 免费人成在线观看视频高潮| 亚洲va在线va天堂va四虎| 特级无码毛片免费视频尤物| 337p日本欧洲亚洲大胆艺术| 国产四虎免费精品视频| 亚洲性无码一区二区三区| 国产免费小视频在线观看| 日日狠狠久久偷偷色综合免费| 久久精品亚洲福利| 久久久久久久99精品免费观看| 亚洲成a人不卡在线观看| 成年人免费视频观看| 黄色一级视频免费| 亚洲精品乱码久久久久久按摩| 18未年禁止免费观看| 亚洲色偷偷综合亚洲AV伊人蜜桃| 国产伦一区二区三区免费| 中文无码日韩欧免费视频| 亚洲最大视频网站| 日本中文一区二区三区亚洲 | 亚洲免费黄色网址| 久久亚洲AV成人无码国产最大| 久久久久亚洲AV成人网人人软件| 日本免费人成网ww555在线| 亚洲伊人久久大香线蕉影院| 国产男女猛烈无遮挡免费视频 | 日韩亚洲国产综合高清| www.亚洲色图.com| 在免费jizzjizz在线播| 黄色网址免费在线| 亚洲第一成年人网站| 亚洲欧洲中文日韩av乱码| 免费观看无遮挡www的视频|