国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

游戲bug幫大模型學物理!準確率超GPT4o近4個百分點

AIGC動態1年前 (2024)發布 量子位
499 0 0

PhysVLM團隊 投稿量子位 | 公眾號 QbitAI融合物理知識的大型視頻語言模型PhysVLM,開源了!它不僅在 PhysGame 基準上展現出最先進的性能,還在通用視頻理解基準上(Video-MME, VCG)表現出領先的性能。在這項研究之前,想讓AI像人類兒童一樣,通過觀察世界理解基本的物理常識,是一個主要挑戰。對于現實世界的視頻來說,全面覆蓋和解釋所有正常的物理現象既困難又不必要。相比之下,游戲視頻(gameplay videos)通常包含違反物理常識的“故障現象”(glitches),這有助于簡化物理常識理解的定義和評估,即專注于解釋物理常識的違反現象,而不是試圖列舉所有存在的正常物理現象。為此,PhysVLM在專門整理的一套數據集上訓練,包括用于評估的PhysGame benchmark、用于監督微調的PhysInstruct數據集和用于偏好對齊的PhysDPO數據集。PhysGame benchmark 設計如圖所示,PhysGame包含880個含有故障現象的游戲視頻,每個視頻都配有一個高質量的多項選擇題,專門針對故障現象的性質進行標注。△PhysGame類別分布PhysGame涵蓋了四個關鍵的物理領域(即力學、學、光學和材料屬性),并細分為12個具體類別(如重力和速度)。力學(Mechanics):該類別涉及力與力矩及其對的影響,提供了解釋和分析視頻中物體的基礎原理。典型案例包括重力、彈性和摩擦力。學(Kinematics):該領域研究不考慮力的情況下的,涉及精細分類,如隨時間變化的速度和加速度。光學(Optics):該領域關注光的行為與特性及其與物質的相互作用,包括反射、折射以及吸收與透射。材料屬性(Material properties):該領域指的是物質固有的特性,包括顏色、剛性、物體形狀以及人體姿態。PhysGame benchmark構建視頻收集和過濾:PhysGame中的視頻主要從Reddit頁面抓取,該頁面包含帶有異常和故障現象的游戲視頻。為了平衡不同的類別,團隊還通過關鍵詞搜索從 YouTube增強視頻數據。團隊根據以下兩項標準進行人工篩查:重復檢查:Reddit論壇可能會多次引用同一視頻,導致重復下載。團隊手動檢查,確保PhysGame benchmark中的視頻不存在重復;內容檢查:下載的視頻可能包含非游戲元素,團隊對這些內容進行了嚴格篩選,確保它們不被納入PhysGame benchmark中。選項生成:本文以多項選擇題的形式創建問答對。具體來說,正確選項描述了視頻中違反物理常識原則的特定故障現象。為了增強干擾選項的可信度,本文要求干擾選項中的故障現象應與視頻中觀察到的個體或動作高度相關,這使視頻LLM理解故障內容,而不僅僅通過識別包含的物體或動作來選擇答案。質量控制:為了保證數據集的質量,本文進行了一項包括人工檢查和自動LLM輔助檢查在內的雙重質量控制過程:人工檢查:所有初步標注的問答對都經過不同人工標注人員的嚴格交叉檢查。對于正確選項,檢查人員必須評估它們是否全面準確地描述了所有存在的物理常識違反實例。對于干擾選項,檢查人員需評估它們是否足夠具有迷惑性;LLM 輔助檢查:團隊去除那些僅憑問題和選項,不需要查看視頻就能由GPT-4o正確回答的問答對。△PhysGame示例PhysInstruct&PhysDPO數據集構建PhysInstruct:為了提升視頻LLM的物理常識理解能力,團隊開發了PhysInstruct數據集用于監督微調。視頻收集過程與PhysGame中的流程相同。為了防止數據泄漏,團隊嚴格排除任何已包含在PhysGame中的視頻。團隊遵循Self-instruct范式通過提示GPT-4o來構建PhysInstruct。PhysDPO:團隊構建了偏好對齊數據集PhysDPO,以提供更可信和可靠的回答。如圖3所示,團隊將PhysInstruct 數據集中生成的答案視為preferred回答,而dis-preferred回答則通過元信息篡改(meta-information hacking)、時間篡改(temporal hacking)和空間篡改(spatial hacking)生成。團隊用誤導性的元信息以及減少幀數和降低幀分辨率的視頻幀來提示 GPT-4o。以下是PhysDPO數據集構建流程圖:模型評估與分析PhysGame benchmark 實驗結果:在所有專有模型中,GPT-4o和Gemini-1.5-pro表現最佳,分別達到了56.1%和55.2%的平均準確率。在所有細分領域中,GPT-4o在摩擦和加速度方面表現優越。相比之下,Gemini-1.5-pro在理解與重力、彈性、反射、吸收與透射、顏色和剛性相關的物理常識方面表現更強。現有的開源模型遠遠落后于專有模型。即便是表現最好的開源模型 LLaVA-OneVision,其平均準確率僅為47.7%。相比之下,本文提出的PhysVLM在所有專有和開源模型中都達到了最先進的性能。與開源方法相比,本文的PhysVLM在12個評估領域中的6個領域達到了最高性能。值得注意的是,PhysVLM-DPO在平均準確率這一指標上比最佳表現的專有模型GPT-4o超出了3.4%。△PhysGame benchmark實驗結果Video-MME benchmark實驗結果:本文的PhysVLM模型在所有7B模型中表現優越。令人驚訝的是,作為7B模型,PhysVLM-SFT和PhysVLM-DPO在整體表現上分別比 34B 模型 LLaVA-NeXT-Video提高了3.2%和3.8%的絕對值。通過比較PhysVLM-SFT和PhysVLM-DPO,團隊發現,使用所提出的PhysDPO數據進行 DPO訓練在短視頻和長視頻上的表現都有所提升,而在中等長度的視頻上的表現略有下降。△Video-MME benchmark實驗結果VCG benchmark實驗結果:在僅使用SFT的模型中,本文的PhysVLM-SFT在平均得分方面表現最佳。在四個子類別的評估中,PhysVLM-SFT在信息正確性和一致性類別上表現尤為出色。與使用DPO或PPO訓練的PPLLaVA和LLaVA-Next-Video相比,本文的PhysVLM-DPO也展現出卓越的性能,進一步驗證了所提出的PhysVLM模型在通用視頻理解中的出色能力。△VCG benchmark實驗結果PhysVLM相關論文、代碼、數據均已開源:pre-prints:https://arxiv.org/abs/2412.01800代碼鏈接:https://github.com/PhysGame/PhysGameleaderboard:https://physgame.github.io/#leaderboard—完—投稿請發郵件到:ai@qbitai.com標題注明【投稿】,告訴我們:你是誰,從哪來,投稿內容?附上論文/項目主頁鏈接,以及聯系方式哦我們會(盡量)及時回復你點這里?關注我,記得標星哦~一鍵三連「分享」、「點贊」和「在看」科技前沿進展日日相見 ~

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        亚洲欧洲一区二区三区久久| 午夜精品福利一区二区蜜股av | 欧美日韩成人一区二区三区| 国产精品五区| 91社区国产高清| 99av国产精品欲麻豆| 96国产粉嫩美女| 久久久一二三| 亚洲观看高清完整版在线观看 | 激情一区二区三区| 精品亚洲国产成人av制服丝袜| 久久人人九九| aaa亚洲精品| 国产a级片网站| 亚洲日本在线视频观看| 国产美女视频免费看| 一本大道久久a久久精品综合| 一级黄色电影片| 日韩你懂的在线播放| 麻豆精品一区二区三区视频| 亚洲天堂网站在线观看视频| 奇米影视777在线欧美电影观看| 久久成人av网站| 99久久99久久精品国产片桃花| 国产精品激情av电影在线观看| 国产精品普通话对白| 精品国产乱码久久久久久郑州公司 | av在线不卡顿| 国产精品久久视频| 免费在线成人| 亚洲精品国产一区| 国产日韩欧美一区二区三区综合| 一路向西2在线观看| 欧美丝袜丝交足nylons| 日本一级片免费| 久久精品国产亚洲一区二区| 97精品视频| 国产精品乱码| 久久综合精品国产一区二区三区 | 99伊人成综合| 日韩中文字幕一区| 国产精品午夜电影| 久久久久亚洲av无码网站| 欧美成人一区二区三区片免费| 欧美一级大片在线视频| 国产脚交av在线一区二区| 免费高清成人在线| 久操网在线观看| 一本久道久久综合中文字幕| 全网免费在线播放视频入口| 久久久在线观看| 日日摸夜夜添夜夜添亚洲女人| 26uuu成人| 偷拍一区二区三区| 免费看一级大片| 国产91av在线| 国产高清久久久| 亚洲视频一二三四| 亚洲国产中文字幕久久网| 成人羞羞视频播放网站| 久久99久久99精品蜜柚传媒| 亚洲欧洲成人精品av97| 女女互磨互喷水高潮les呻吟| 久久精品99国产精品酒店日本| 伊人天天综合| 国产va亚洲va在线va| 欧美日韩aaa| 久久爱www成人| 免费看污久久久| 无码av中文一区二区三区桃花岛| 网站一区二区| 九色91视频| 午夜成人在线视频| 盗摄牛牛av影视一区二区| 粉嫩av四季av绯色av第一区| 国产精品国产a级| 麻豆明星ai换脸视频| 国产精品自拍视频| 国产精品污污网站在线观看| 欧日韩不卡视频| 国产精品欧美日韩| 中文字幕第一页久久| 91香蕉视频污在线观看| 国产精品久久久久久久久久久久久久 | 96久久精品| 久久久久久久一区| 呻吟揉丰满对白91乃国产区| 国产成人综合亚洲| 国产欧美精品日韩区二区麻豆天美| 老熟妇一区二区| 国产精品青草久久久久福利99| 久久精品亚洲乱码伦伦中文| 一本色道久久88| 国产精品久久久久久久久粉嫩av | 亚洲激精日韩激精欧美精品| 久久久噜噜噜www成人网| 亚洲女人天堂色在线7777| 男女精品网站| 黄色小视频免费网站| 精品中文字幕乱| 久久综合色婷婷| 国产精品久久久精品四季影院| 动漫一区二区在线| 色婷婷av一区二区三区gif| 国产一区二区三区91| 亚洲人成影视在线观看| 精品久久国产字幕高潮| 久久aⅴ国产紧身牛仔裤| 五月六月丁香婷婷| 日本午夜在线亚洲.国产| 综合欧美亚洲日本| 亚洲丁香日韩| 国产玉足脚交久久欧美| 少妇激情综合网| 99视频在线精品| 日韩国产一二三区| 精品一区二区三区日本| 欧美老肥妇做.爰bbww| 影音先锋中文字幕一区二区| 激情五月俺来也| 91精品国产九九九久久久亚洲| 蜜桃精品一区二区| 欧美日韩在线高清| 国产精品传媒入口麻豆| 日韩黄色一区二区| 日本成人黄色片| 亚洲一区在线观看免费| 婷婷亚洲综合| 欧美激情国内自拍| 国产免费成人av| 一本一道久久a久久精品| 欧美激情日韩| 亚洲一二三四五| 91精品久久香蕉国产线看观看| 一本高清dvd不卡在线观看| 亚洲精品免费观看| 老熟妇一区二区| 久久综合入口| 亚洲品质视频自拍网| 91捆绑美女网站| 日韩人体视频| 欧美一级裸体视频| 国产欧美一区二区三区久久人妖| 色香色香欲天天天影视综合网| 亚洲精品四区| 成人欧美一区二区三区黑人一 | 精品国产123| 成人午夜激情片| 加勒比色老久久爱综合网| 北条麻妃av高潮尖叫在线观看| 日韩av手机在线观看| 在线观看日韩高清av| 精品在线观看视频| 亚洲精品aⅴ| 久久久久久蜜桃一区二区| 国产免费一区二区三区在线观看| 欧美日韩国产美| 成人av电影在线网| 日韩欧美自拍| 国产高潮呻吟久久| 黄色一级大片免费| 欧美一级bbbbb性bbbb喷潮片| 一本到不卡精品视频在线观看| 看国产成人h片视频| 91精品导航| 一个人看的视频www| 国产日韩欧美一区二区| 中文字幕亚洲精品| 香蕉加勒比综合久久 | 99九九99九九九99九他书对| 91超碰rencao97精品| 日韩精品一区二区视频| 18涩涩午夜精品.www| 99re国产精品| 精品99re| 免费欧美一级片| 在线观看日韩羞羞视频| 日韩av电影在线免费播放| 日韩一卡二卡三卡| 国产精品福利一区二区| 首页国产欧美久久| 奇米影视777在线欧美电影观看| 风韵丰满熟妇啪啪区老熟熟女| 日韩福利一区二区三区| 91高清在线免费观看| 日韩你懂的在线播放| 中文字幕亚洲精品在线观看| 视频一区国产视频| 一本色道久久综合狠狠躁的番外| 免费无码一区二区三区| 日本xxxxxxxxxx75| 国产精品免费一区二区三区四区| www.日韩.com| 欧美高清视频在线高清观看mv色露露十八| 99久久免费视频.com| 日韩一级大片| 亚洲国产国产| 久久福利免费视频| а 天堂 在线| 成人毛片100部免费看| 51精品国产人成在线观看| 欧美老少配视频| 欧美成人video| 五月综合激情网| 91一区二区三区在线播放| 国产精品日韩久久久| 成人看的视频| 精品国产第一国产综合精品| 国模私拍在线观看| 午夜精品久久久内射近拍高清| 日本在线视频不卡| 91在线观看欧美日韩| 久久久久中文字幕| 亚洲精品在线观看www| 欧美日韩精品欧美日韩精品| 亚洲黄色在线视频| 99riav一区二区三区| 精品人妻一区二区三区香蕉| 夜夜添无码一区二区三区| 欧洲av一区| 亚洲淫片在线视频| 日韩美女视频在线观看| 久久精品国产亚洲精品| 亚洲成人av片在线观看| 欧美视频一二三区| 天天综合网天天综合色| 中文字幕亚洲一区二区va在线| 成人小视频免费观看| 日本成人在线一区| 99精品视频免费观看视频| 日韩欧美一区免费| 少妇高潮一区二区三区| 少妇高潮一区二区三区99| 久操视频在线观看免费| 中文字幕乱码一区| 人妻换人妻仑乱| 亚洲综合欧美激情| 久久精品视频91| 欧美成人一区二区在线观看| 三级在线免费观看| 三年中文高清在线观看第6集| 免费看成人午夜电影| 国产欧美日韩伦理| 国产经典一区二区三区| 91亚洲精品在线| 成人免费直播live| 国产玖玖精品视频| 国产精品精品视频一区二区三区| 91精品国产91久久久| 色综合视频一区中文字幕| 日韩在线免费av| 一区二区亚洲精品国产| 一区二区中文字幕| 国产亚洲精品一区二区| 国产亚洲成av人片在线观看桃| 日韩电影在线观看中文字幕 | 好吊一区二区三区| 欧美日韩免费| 亚洲经典在线| 国产午夜久久| 天堂午夜影视日韩欧美一区二区| 国产精品亚洲综合久久| 香蕉久久久久久久av网站| 国产一区二区三区久久久久久久久| 黄色成人91| 国产日韩免费| 日韩高清欧美激情| 久久精品国产精品亚洲精品 | 国产视频视频一区| 国产精品每日更新| 日韩久久一区二区| 亚洲一二三四区| 精品福利在线视频| 欧美自拍丝袜亚洲| 日韩精品最新网址| 亚洲欧美视频在线| 中文一区二区视频| 蜜臀久久99精品久久久无需会员| 欧美激情免费在线| 亚洲自拍偷拍九九九| 亚洲综合激情另类小说区| 狠狠久久五月精品中文字幕| 在线视频你懂得一区| 日韩一级黄色片| 亚洲欧美日韩中文在线| 久久伊人精品一区二区三区| 久久久亚洲精选| 91精品国产综合久久久久久蜜臀 | 欧美性xxxx69| 成人在线免费高清视频| 午夜肉伦伦影院| 久久aaaa片一区二区| 三上悠亚影音先锋| 精品视频在线观看免费观看| 亚洲瘦老头同性70tv| 欧美午夜视频| 久久91精品久久久久久秒播| 久久久久亚洲蜜桃| 午夜成人免费视频| 亚洲成人教育av| 欧美高清视频免费观看| 成人国产精品久久久久久亚洲| 久久久久无码国产精品一区| 日本道在线视频| 天堂av2020| 久草福利资源在线| 久久av导航| 日韩不卡在线观看日韩不卡视频| 国产成人精品在线看| 亚洲视频一区在线观看| 欧美乱妇23p| 精品国产一区二区三区久久久| 国产成人av网| 日本高清久久一区二区三区| www国产黄色| 免费观看av网站| 全国精品免费看| 亚洲欧美卡通另类91av| 99久久久免费精品国产一区二区| 夜夜精品视频一区二区| 精品国产制服丝袜高跟| 欧美精品videosex极品1| 高清视频在线观看一区| 久久精品无码中文字幕| wwwxx日本| 久久狠狠久久| 男女性色大片免费观看一区二区 | 鬼打鬼之黄金道士1992林正英| 亚洲一区 在线播放| 亚洲熟妇一区二区| 成人高潮视频| 性一交一乱一区二区洋洋av| 欧美国产精品一区| 777午夜精品视频在线播放| 欧美疯狂xxxx大交乱88av| 免费99视频| 超碰超碰在线观看| 日韩精品成人| 久久av一区二区三区| 亚洲天堂免费看| 日韩高清人体午夜| 91九色在线视频| 一区二区传媒有限公司| 日本在线观看网址| 欧美精品啪啪| 国产精品护士白丝一区av| 亚洲国产福利在线| 91精品国产自产在线老师啪 | 欧美激情一二三区| 欧美成人精品二区三区99精品| 国产成+人+综合+亚洲欧美丁香花| 青春草在线视频免费观看| 黑丝av在线播放| 99热在线成人| 久久综合狠狠综合久久激情| 欧美一区二区私人影院日本| 欧美亚洲国产另类| 97视频在线免费| 黑人狂躁日本娇小| 国产日韩欧美一区| 亚洲aⅴ怡春院| 欧美大片在线看免费观看| 欧美在线视频一区二区三区| 黄页网站在线看| 久久免费精品视频在这里| 久久综合久色欧美综合狠狠| 精品少妇一区二区三区日产乱码 | 国产精品久久久久婷婷| 亚洲国产精品999| 国产精品久久久久久久久久久久冷 | 欧美亚洲一区二区三区| 性做久久久久久免费观看欧美| 美女撒尿一区二区三区| 亚洲欧美电影在线观看| 天天操天天舔天天射| 亚洲三级免费| 日韩欧美在线观看视频| 国产91成人在在线播放| 99色精品视频| 日韩高清影视在线观看| 久久这里只精品最新地址| 亚洲精品中文字幕女同| 日本不卡高清视频一区| 国产精品一区视频网站| 8x8x成人免费视频| 91精品国产91久久久久久黑人| **欧美大码日韩| 久久99青青精品免费观看| 欧美狂野激情性xxxx在线观| 9l视频自拍蝌蚪9l视频成人| 99精品久久99久久久久| 亚洲欧美日韩国产中文专区| 亚洲激情一区二区三区| 午夜精品一区二区三区视频| 激情久久久久久久久久久久久久久久| 欧美久久久一区| 久久精品第九区免费观看| 国产黄色录像视频| 国模一区二区三区白浆| 亚洲精品美女在线观看播放|