<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        字節(jié)多模態(tài)大模型PixelLM:高效像素級推理,無需依賴SAM

        AIGC動態(tài)1年前 (2023)發(fā)布 量子位
        459 0 0

        字節(jié)多模態(tài)大模型PixelLM:高效像素級推理,無需依賴SAM

        AIGC動態(tài)歡迎閱讀

        原標題:字節(jié)多模態(tài)大模型PixelLM:高效像素級推理,無需依賴SAM
        關鍵字:模型,字節(jié)跳動,目標,數據,圖像
        文章來源:量子位
        內容字數:5403字

        內容摘要:


        夢晨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI多模態(tài)大模型爆發(fā),準備好進入圖像編輯、自動駕駛和機器人技術等細粒度任務中實際應用了嗎?
        目前大多數模型的能力還是局限于生成對整體圖像或特定區(qū)域的文本描述,在像素級理解方面的能力(例如物體分割)相對有限。
        針對這個問題,一些工作開始探索借助多模態(tài)大模型來處理用戶的分割指令(例如,“請分割出圖片中富含維生素C的水果”)。
        然而,市面上的方法都存在兩個主要缺點:
        1)無法處理涉及多個目標對象的任務,而這在現(xiàn)實世界場景中是不可或缺的;
        2)依賴于像SAM這樣的預訓練圖像分割模型,而SAM的一次前向傳播需要的計算量已經足夠 Llama-7B產生500多個token了。
        為了解決此問題,字節(jié)跳動智能創(chuàng)作團隊聯(lián)合北京交通大學、北京科技大學的研究人員提出了首個無需依賴SAM的高效像素級推理大模型PixelLM。
        在具體介紹它之前,先來體驗幾組PixelLM實際分割的效果:
        相比之前的工作,PixelLM的優(yōu)勢在于:
        能夠熟練處理任意數量的開放域目標和多樣化的復雜推理分割任務。
        避免了額外的、成本高昂的分割模型,提升了效率和對不同應用的遷移能力。
        進一步


        原文鏈接:字節(jié)多模態(tài)大模型PixelLM:高效像素級推理,無需依賴SAM

        聯(lián)系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業(yè)新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 在线免费视频你懂的| 特级av毛片免费观看| 69国产精品视频免费| 亚洲Av高清一区二区三区| 女人与禽交视频免费看| 免费激情网站国产高清第一页 | 亚洲AV成人片色在线观看| 狼群影院在线观看免费观看直播| 一级特黄色毛片免费看| 亚洲精品免费在线视频| 国产最新凸凹视频免费| 中文字幕一区二区免费| 中文文字幕文字幕亚洲色| 国产成人亚洲影院在线观看| 18禁美女裸体免费网站| 国产做国产爱免费视频| 亚洲一级片免费看| 亚洲毛片无码专区亚洲乱| 亚洲国产精品无码专区影院| 成年女人午夜毛片免费看| 中文在线观看永久免费| 亚洲国产日韩精品| 亚洲成a人片在线播放| 91久久成人免费| 亚洲日韩在线观看免费视频| 国产成人亚洲精品播放器下载 | 久久免费视频观看| 亚洲精品日韩一区二区小说| 亚洲国产另类久久久精品小说| 毛片a级毛片免费播放100| 动漫黄网站免费永久在线观看| 国产午夜无码精品免费看| 中文字幕在线视频免费| 三年片免费高清版| 精品亚洲永久免费精品| 色欲色香天天天综合网站免费| 免费人成视频在线观看免费| 色屁屁www影院免费观看视频| 四虎影视久久久免费| 亚洲人成网站色7799| 亚洲精品无码久久久久久久|