<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        字節多模態大模型PixelLM:高效像素級推理,無需依賴SAM

        AIGC動態2年前 (2023)發布 量子位
        459 0 0

        字節多模態大模型PixelLM:高效像素級推理,無需依賴SAM

        AIGC動態歡迎閱讀

        原標題:字節多模態大模型PixelLM:高效像素級推理,無需依賴SAM
        關鍵字:模型,字節跳動,目標,數據,圖像
        文章來源:量子位
        內容字數:5403字

        內容摘要:


        夢晨 發自 凹非寺量子位 | 公眾號 QbitAI多模態大模型爆發,準備好進入圖像編輯、自動駕駛和機器人技術等細粒度任務中實際應用了嗎?
        目前大多數模型的能力還是局限于生成對整體圖像或特定區域的文本描述,在像素級理解方面的能力(例如物體分割)相對有限。
        針對這個問題,一些工作開始探索借助多模態大模型來處理用戶的分割指令(例如,“請分割出圖片中富含維生素C的水果”)。
        然而,市面上的方法都存在兩個主要缺點:
        1)無法處理涉及多個目標對象的任務,而這在現實世界場景中是不可或缺的;
        2)依賴于像SAM這樣的預訓練圖像分割模型,而SAM的一次前向傳播需要的計算量已經足夠 Llama-7B產生500多個token了。
        為了解決此問題,字節跳動智能創作團隊聯合北京交通大學、北京科技大學的研究人員提出了首個無需依賴SAM的高效像素級推理大模型PixelLM。
        在具體介紹它之前,先來體驗幾組PixelLM實際分割的效果:
        相比之前的工作,PixelLM的優勢在于:
        能夠熟練處理任意數量的開放域目標和多樣化的復雜推理分割任務。
        避免了額外的、成本高昂的分割模型,提升了效率和對不同應用的遷移能力。
        進一步


        原文鏈接:字節多模態大模型PixelLM:高效像素級推理,無需依賴SAM

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲人成人伊人成综合网无码| 免费看搞黄视频网站| 亚洲av无码一区二区三区观看| 亚洲精品美女视频| 亚洲精品456人成在线| 免费看一级毛片在线观看精品视频| 新最免费影视大全在线播放| 99在线在线视频免费视频观看| 好男人视频在线观看免费看片| 亚洲精品视频免费观看| 午夜影视日本亚洲欧洲精品一区| 亚洲国色天香视频| 野花香高清视频在线观看免费 | 又硬又粗又长又爽免费看 | 亚洲精品无码永久中文字幕| 亚洲视频中文字幕| 九九综合VA免费看| 国产在线a免费观看| 亚洲午夜精品一级在线播放放| 亚洲国产成人精品无码区在线秒播 | 午夜电影免费观看| 免费VA在线观看无码| 国产综合亚洲专区在线| 亚洲日韩一区二区三区| 国产中文字幕免费| 亚洲国产美女福利直播秀一区二区| 91免费精品国自产拍在线不卡| 亚洲AV综合色一区二区三区| 污污污视频在线免费观看| 亚洲精品无码成人片久久| 最近2019中文字幕免费直播| 亚洲日韩精品无码一区二区三区| 黄色网址大全免费| 青青草国产免费久久久91| 无码专区—VA亚洲V天堂| 黄色免费网站网址| 亚洲综合网美国十次| 无码国模国产在线观看免费| 亚洲精品色播一区二区| 动漫黄网站免费永久在线观看| 老子影院午夜伦不卡亚洲|