<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        評估大模型不看輸出看「內在」,上交大新測試指標入選NeurIPS 2024

        AIGC動態6個月前發布 量子位
        375 0 0

        評估大模型不看輸出看「內在」,上交大新測試指標入選NeurIPS 2024

        AIGC動態歡迎閱讀

        原標題:評估大模型不看輸出看「內在」,上交大新測試指標入選NeurIPS 2024
        關鍵字:模型,表征,語言,數據,圖像
        文章來源:量子位
        內容字數:0字

        內容摘要:


        上交大MIFA實驗室 魏來 投稿量子位 | 公眾號 QbitAI能夠深入大模型內部的新評測指標來了!
        上交大MIFA實驗室提出了全新的大模型評估指標Diff-eRank。
        不同于傳統評測方法,Diff-eRank不研究模型輸出,而是選擇了分析其背后的隱藏表征。
        該方法從信息論和幾何的視角,分析大模型的隱藏表征,量化大語言模型在訓練前后如何剔除數據中的冗余信息,并以此作為衡量模型性能的指標。
        對于多模態大模型,研究團隊也設計了基于秩的評估方法,用于衡量不同模態之間的對齊程度。
        目前,本工作已被NeurIPS 2024接收。
        將評估深入到大模型內部在進行Diff-eRank的相關工作之前,作者首先提出了這樣一個問題——
        一個語言模型是如何從海量的訓練數據中「學習」到知識的?
        對于這個問題,前OpenAI科學家Ilya Sutskever在2023年的演講中曾經這樣說:
        大語言模型海量數據中訓練時,會逐步消除其表征空間中的冗余信息,使得數據的表征變得更加規整、結構化。
        這個過程類似于「去噪」,即模型逐漸剔除數據中的無用信息,同時提取出更重要的模式和特征。
        傳統的評估方法多集中于模型在下游任務


        原文鏈接:評估大模型不看輸出看「內在」,上交大新測試指標入選NeurIPS 2024

        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 两性刺激生活片免费视频| 国产成人精品免费视频大| 亚洲视频在线免费观看| 无码国产精品一区二区免费虚拟VR| 亚洲av午夜电影在线观看| 亚洲色偷偷偷鲁综合| 久久不见久久见免费影院| yellow视频免费在线观看| 亚洲的天堂av无码| 亚洲国产婷婷综合在线精品| 日韩精品久久久久久免费| 国产精品亚洲精品久久精品| 九九免费精品视频在这里| 亚洲av女电影网| 免费一级毛片在播放视频| 99久热只有精品视频免费观看17| 亚洲AV无码一区二区三区鸳鸯影院 | 中文字幕成人免费高清在线视频| 亚洲一区二区三区免费观看| 国产AV无码专区亚洲AWWW| 成人免费a级毛片| 亚洲欧洲免费视频| 男女交性无遮挡免费视频| 亚洲中文久久精品无码1| 国产亚洲精品资源在线26u| 国产精品极品美女免费观看| 久久www免费人成看片| 精品一区二区三区高清免费观看 | 91免费国产在线观看| 成人一区二区免费视频| 亚洲AV无码一区二区三区鸳鸯影院| 亚洲成人福利网站| 亚洲精品V欧洲精品V日韩精品| 免费va在线观看| 啦啦啦手机完整免费高清观看| 91香蕉国产线在线观看免费| 99精品全国免费观看视频..| 色婷婷综合缴情综免费观看| 亚洲高清毛片一区二区| 亚洲AV无码一区二区三区国产| 四虎影院免费视频|