<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        英偉達開源NVLM 1.0屠榜多模態(tài)!純文本性能不降反升

        AIGC動態(tài)8個月前發(fā)布 新智元
        320 0 0

        英偉達開源NVLM 1.0屠榜多模態(tài)!純文本性能不降反升

        AIGC動態(tài)歡迎閱讀

        原標題:英偉達開源NVLM 1.0屠榜多模態(tài)!純文本性能不降反升
        關(guān)鍵字:模型,標簽,文本,性能,視覺
        文章來源:新智元
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        新智元報道編輯:LRS
        【新智元導(dǎo)讀】NVLM 1.0系列多模態(tài)大型語言模型在視覺語言任務(wù)上達到了與GPT-4o和其他開源模型相媲美的水平,其在純文本性能甚至超過了LLM骨干模型,特別是在文本數(shù)學(xué)和編碼基準測試中,平均準確率提高了4.3個百分點。文本大模型經(jīng)過多年的發(fā)展,逐漸發(fā)展成了統(tǒng)一的純解碼器Transformer架構(gòu)。
        反觀現(xiàn)有的多模態(tài)大模型架構(gòu)仍然處于混亂狀態(tài),開源模型在選擇LLM主干、視覺編碼器以及訓(xùn)練數(shù)據(jù)方面都存在差異,性能優(yōu)異的閉源多模態(tài)大模型也沒有公布相關(guān)信息,無法直接進行模型對比和研究。
        并且,不同模型在處理高分辨率圖像輸入時的設(shè)計(如動態(tài)高分辨率)雖然可以提高了與OCR相關(guān)的任務(wù)(例如,OCRBench)的性能,但與低分辨率版本模型相比,在推理相關(guān)任務(wù)(例如,MMMU)上的準確率卻會下降。
        此外,雖然開源的多模態(tài)大模型在視覺-語言任務(wù)上取得了非常亮眼的基準測試結(jié)果,但在純文本任務(wù)上的性能卻有顯著下降,與領(lǐng)先的閉源模型(如GPT-4o)的表現(xiàn)并不一致。
        為了改變這一現(xiàn)狀,英偉達的研究團隊最近宣布推出NVLM 1.0,在視覺-語言任務(wù)上取得了最先進的成果,能夠與最強大


        原文鏈接:英偉達開源NVLM 1.0屠榜多模態(tài)!純文本性能不降反升

        聯(lián)系作者

        文章來源:新智元
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 成人在线免费看片| 亚洲熟女综合色一区二区三区 | 亚洲欧美成人一区二区三区 | 免费很黄很色裸乳在线观看| 最新猫咪www免费人成| 最新仑乱免费视频| 成人最新午夜免费视频| 女人与禽交视频免费看| 在线免费观看污网站| 日本成人免费在线| 国产成人高清精品免费鸭子| 国产精品免费看香蕉| 啊v在线免费观看| 亚洲精品国产日韩无码AV永久免费网| 亚洲高清无码在线观看| 国产aⅴ无码专区亚洲av麻豆| 亚洲乱码精品久久久久..| 久久久影院亚洲精品| 国产AV无码专区亚洲精品| 亚洲精品综合一二三区在线 | 国产真实伦在线视频免费观看| 国产精品深夜福利免费观看| 国产区卡一卡二卡三乱码免费| 亚洲精品456播放| 久久亚洲国产中v天仙www| 久久久亚洲欧洲日产国码aⅴ| 亚洲日本va在线观看| 国产亚洲午夜精品| 国产又黄又爽胸又大免费视频| 无码国产精品一区二区免费模式 | 99久久久精品免费观看国产| 女人张腿给男人桶视频免费版| 国产jizzjizz视频免费看| 青青草原亚洲视频| 久久久久亚洲AV无码网站| 亚洲精品无码不卡在线播放| 丁香六月婷婷精品免费观看| 日韩免费人妻AV无码专区蜜桃| 免费H网站在线观看的| 丰满妇女做a级毛片免费观看| 免费在线观看一级片|