<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        顛覆手機操控體驗:華為與哈工深聯合發布SPA-Bench評估新標準

        AIGC動態7個月前發布 AI科技評論
        425 0 0

        華為諾亞方舟實驗室與哈工大(深圳)聯合提出的手機操控智能體評估框架。

        顛覆手機操控體驗:華為與哈工深聯合發布SPA-Bench評估新標準

        原標題:華為與哈工深等最新研究成果:SPA-Bench,手機操控智能體評估新標準
        文章來源:AI科技評論
        內容字數:9414字

        引言

        隨著智能手機在日常生活中的普及,手機操控智能體的研究逐漸成為大模型領域的重要方向。然而,現有基準測試存在多種局限性,亟需提升評估標準。華為諾亞方舟實驗室與哈爾濱工業大學(深圳)聯合提出的SPA-Bench(SmartPhone Agent Benchmark)為這一領域提供了新的評估框架。

        1. 現有基準測試的局限性

        現有的手機智能體評估框架主要集中于簡單的系統應用任務,缺乏對復雜跨應用操作和多語言場景的全面支持。此外,大多數基準測試中涉及的智能體種類有限,研究者難以進行深入比較,降低了研究結論的全面性。現有驗證機制也缺乏靈活性,無法適應UI更新的需求。

        2. SPA-Bench的核心設計

        SPA-Bench通過以下三方面解決現有基準測試的痛點:

        (1)任務設計:涵蓋340個任務,包括單應用和跨應用任務,任務復雜性分為,增加了對真實場景的覆蓋。

        (2)智能體框架:支持多種智能體集成,具有高度靈活的模塊化設計,研究者可快速集成與比較不同模型。

        (3)自動化流程:提供全面的任務驗證流程及多維度評估指標,提高評估的準確性與效率。

        3. 實驗結果與分析

        實驗結果顯示,不同智能體在任務成功率上的表現差異顯著。M3A為表現最佳的智能體,其在單應用任務中的成功率高于跨應用任務,同時英文任務的成功率也明顯優于中文任務。此外,成功率與資源消耗之間存在權衡,高成功率往往伴隨著更高的計算資源和時間成本。

        4. 未來研究方向

        未來研究可集中在增強視覺感知、豐富數據集多樣性、改進記憶保留機制、強化錯誤處理、優化任務終止判斷以及提升執行效率與成本優化等方面。這將進一步提升手機操控智能體的性能,推動其實際應用。

        總結

        SPA-Bench為手機操控智能體研究提供了全面的評估工具,填補了現有基準測試的空白,展望未來有望推動手機智能體技術的普及與發展。


        聯系作者

        文章來源:AI科技評論
        作者微信:
        作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 皇色在线视频免费网站| 黄床大片30分钟免费看| 中文字幕无码日韩专区免费| 亚洲人成网站在线观看青青| 美女羞羞视频免费网站| 亚洲AV网站在线观看| 韩国日本好看电影免费看| 亚洲1234区乱码| 国产一卡2卡3卡4卡无卡免费视频| 久久九九免费高清视频| 欧洲人免费视频网站在线| 女人18毛片特级一级免费视频| 伊人婷婷综合缴情亚洲五月| 亚洲一级毛片视频| 色窝窝免费一区二区三区| 亚洲男人天堂2018av| 免费视频中文字幕| 少妇中文字幕乱码亚洲影视 | 成人免费无码大片a毛片软件| 亚洲伊人久久大香线蕉综合图片| 亚洲噜噜噜噜噜影院在线播放| 有色视频在线观看免费高清在线直播| 4虎1515hh永久免费| 亚洲一区二区三区在线观看蜜桃| 久久www免费人成精品香蕉| 男女交性永久免费视频播放| 91情国产l精品国产亚洲区| 亚洲精品视频免费| 亚洲国产精品无码久久SM| 免费看片在线观看| 亚洲AV无码一区二区大桥未久 | 国产中文字幕在线免费观看| 亚洲av无码片在线播放| 成人午夜影视全部免费看| 亚洲成AV人片在WWW色猫咪| 香蕉97超级碰碰碰免费公| 男男gvh肉在线观看免费| 亚洲VA中文字幕不卡无码| 国产精品免费看久久久香蕉| 免费一级毛片在级播放| 亚洲av午夜国产精品无码中文字|