<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        清華大學與智譜 AI 聯合推出 CogAgent:基于多模態大模型的 GUI Agent,具備視覺問答、視覺定位等能力

        AIGC動態2年前 (2024)發布 AI前線
        441 0 0

        清華大學與智譜 AI 聯合推出 CogAgent:基于多模態大模型的 GUI Agent,具備視覺問答、視覺定位等能力

        AIGC動態歡迎閱讀

        原標題:清華大學與智譜 AI 聯合推出 CogAgent:基于多模態大模型的 GUI Agent,具備視覺問答、視覺定位等能力
        關鍵字:解讀,模型,視覺,圖像,分辨率
        文章來源:AI前線
        內容字數:3775字

        內容摘要:


        作者 | 凌敏
        近日,清華 KEG 實驗室與智譜 AI 聯合推出了視覺 GUI Agent——CogAgent,CogAgent 是一個通用的視覺理解大模型,具備視覺問答、視覺定位(Grounding)、GUI Agent 等多種能力,可接受 1120×1120 的高分辨率圖像輸入。在 9 個經典的圖像理解榜單上(含 VQAv2,STVQA, DocVQA,TextVQA,MM-VET,POPE 等)取得了通用能力第一的成績,并在涵蓋電腦、手機的 GUI Agent 數據集上(含 Mind2Web,AITW 等),大幅超過基于 LLM 的 Agent,取得第一。
        在網頁 Agent 數據集 Mind2Web 上的性能
        在手機 Agent 數據集 AITW 上的性能
        為了更好地促進多模態大模型、Agent 社區的發展,目前團隊已將 CogAgent-18B 開源至 GitHub 倉庫,并提供了網頁版 Demo。
        論文鏈接:https://arxiv.org/pdf/2312.08914.pdf
        GitHub 項目地址(含開源模型、網頁版 Demo):https://github.com


        原文鏈接:清華大學與智譜 AI 聯合推出 CogAgent:基于多模態大模型的 GUI Agent,具備視覺問答、視覺定位等能力

        聯系作者

        文章來源:AI前線
        作者微信:ai-front
        作者簡介:面向AI愛好者、開發者和科學家,提供AI領域技術資訊、一線業界實踐案例、搜羅整理業界技術分享干貨、AI論文解讀。每周一節技術分享公開課,助力你全面擁抱人工智能技術。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 99久久成人国产精品免费| 一级做性色a爰片久久毛片免费| 亚洲videos| 又硬又粗又长又爽免费看| 小草在线看片免费人成视久网| 97碰公开在线观看免费视频| 伊在人亚洲香蕉精品区麻豆| 精品无码一区二区三区亚洲桃色| 国产成人精品久久亚洲高清不卡| 中文字幕乱码一区二区免费| 国产一级特黄高清免费大片| 亚洲AV无码久久精品狠狠爱浪潮| 精品久久久久久久久亚洲偷窥女厕| 日韩精品免费一区二区三区| 精品亚洲aⅴ在线观看| 日本三级2019在线观看免费| 亚洲av无码国产精品色午夜字幕 | 亚洲第一成年男人的天堂| 久久精品国产亚洲AV未满十八| 国产美女无遮挡免费视频网站| 亚洲国产精品成人综合久久久| 成av免费大片黄在线观看| h片在线免费观看| 一个人看的www免费在线视频| 国产成人久久精品亚洲小说| 无码国产精品一区二区免费| 亚洲小说区图片区| 日韩一区二区免费视频| gogo免费在线观看| 亚洲JIZZJIZZ中国少妇中文| 亚洲av无码一区二区三区天堂| 国产一卡二卡3卡四卡免费| 久久水蜜桃亚洲AV无码精品| 精品久久久久久亚洲| 亚洲喷奶水中文字幕电影 | 免费国内精品久久久久影院| 亚洲午夜福利精品久久| 美女羞羞免费视频网站| 永久久久免费浮力影院 | 亚洲欧美日韩中文无线码 | 亚洲中文字幕无码mv|