<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        揭開在線購物新紀元:多樣任務真實數據助力Shopping MMLU基準發布!

        AIGC動態6個月前發布 量子位
        327 0 0

        基于亞馬遜真實在線購物數據打造

        揭開在線購物新紀元:多樣任務真實數據助力Shopping MMLU基準發布!

        原標題:多樣任務真實數據,大模型在線購物基準Shopping MMLU開源|NeurIPS&KDD Cup 2024
        文章來源:量子位
        內容字數:5206字

        在線購物領域最強大模型的評估基準——Shopping MMLU

        近期,亞馬遜聯合香港科技大學和圣母大學,共同推出了一個針對在線購物領域的大規模評測基準——Shopping MMLU。該基準旨在全面評估大語言模型(LLM)在在線購物中的能力與潛力,尤其是面對多任務和少樣本學習的挑戰。

        一、評測基準的必要性

        在線購物的復雜性主要體現在以下幾個方面:

        1. 多任務性:在線購物涉及多種實體(商品、屬性、評論等)和用戶行為(瀏覽、查詢、購買等),需要模型具備聯合建模能力。
        2. 少樣本性:冷啟動場景導致新用戶和新商品的出現,模型需具備少樣本學習能力。

        二、Shopping MMLU的構建

        Shopping MMLU覆蓋了四項在線購物能力,共計57個任務,包括:

        1. 在線購物概念理解
        2. 在線購物知識推理
        3. 用戶行為理解
        4. 多語言能力

        該基準大部分基于真實的亞馬遜在線購物數據構建,經過人工檢驗以確保數據質量。

        三、實驗結果與發現

        研究對27個主流大語言模型進行了評估,發現:

        1. 閉源模型(如Claude-3)整體表現優于開源模型,但后者逐漸縮小差距。
        2. 特定領域模型(如eCeLLM)并未在同參數量級下取得最佳成績,顯示出Shopping MMLU的難度。

        四、模型強化的策略

        研究分析了如何通過微調和大模型增強手段提升模型在Shopping MMLU上的表現。結果表明:

        1. 模型在不同能力和任務上的得分高度正相關,表明知識的共享性。
        2. 通用能力強的模型在特定領域的應用更為有效,微調需注重數據質量。

        五、總結與展望

        Shopping MMLU為在線購物領域提供了一個全面的評測標準,能夠有效評估大語言模型的能力與潛力。該基準的開源與維護,鼓勵研究人員深入探索相關應用,為后續研究奠定了基礎。未來,Shopping MMLU將繼續吸引新模型參與評估,推動在線購物領域的技術進步。

        更多信息可參考論文和GitHub資源:

        論文:鏈接

        數據及評測代碼:鏈接

        評估榜單:鏈接


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产亚洲精午夜久久久久久| 成年女人免费v片| 免费视频爱爱太爽了| 91香蕉视频免费| 日韩免费毛片视频| 国产专区一va亚洲v天堂| 久久精品国产亚洲香蕉| 亚洲综合丁香婷婷六月香| 99亚洲精品卡2卡三卡4卡2卡| 日韩毛片在线免费观看| 久久免费区一区二区三波多野| 99无码人妻一区二区三区免费| 国产成人免费片在线观看| 亚洲精品无码av人在线观看| 亚洲国产精品专区| 美女被免费视频网站a| 久久免费看少妇高潮V片特黄| 岛国av无码免费无禁网站| 久久国产成人亚洲精品影院| 亚洲一区综合在线播放| 日本亚洲欧美色视频在线播放| 中出五十路免费视频| 免免费国产AAAAA片| 免费一级毛片不卡在线播放| 久久久亚洲精品国产| 中文字幕无码精品亚洲资源网久久| 无码毛片一区二区三区视频免费播放 | 日本大片在线看黄a∨免费| 区三区激情福利综合中文字幕在线一区亚洲视频1 | 精品国产日韩亚洲一区91| 两个人看的www高清免费视频 | 女人18毛片水真多免费看 | 免费a级毛片在线观看| 亚洲网站在线观看| 色婷婷精品免费视频| 亚洲一区免费在线观看| 亚洲精品无码专区2| 亚洲三级视频在线观看| 中文字幕在线免费播放| 成人免费无码大片a毛片软件 | 亚洲精品无码专区|