首次引入GPT-4o!圖像自動(dòng)評估新基準(zhǔn)來啦
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:首次引入GPT-4o!圖像自動(dòng)評估新基準(zhǔn)來啦
關(guān)鍵字:圖像,人類,團(tuán)隊(duì),數(shù)據(jù),評分
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
DreamBench++團(tuán)隊(duì) 投稿量子位 | 公眾號 QbitAI面對層出不窮的個(gè)性化圖像生成技術(shù),一個(gè)新問題擺在眼前:
缺乏統(tǒng)一標(biāo)準(zhǔn)來衡量這些生成的圖片是否符合人們的喜好
對此,來自清華、西交大、伊利諾伊厄巴納-香檳分校、中科院、曠視的研究人員共同推出了一項(xiàng)新基準(zhǔn)DreamBench++。
通過收集不同的圖像和提示,團(tuán)隊(duì)利用GPT-4o實(shí)現(xiàn)了符合人類偏好的自動(dòng)評估。
簡單來說,通過精心設(shè)計(jì)prompt以及引入思維鏈提示,團(tuán)隊(duì)讓GPT-4o在圖像評估過程中學(xué)會了像人類一樣思考,并展現(xiàn)其思考過程。
為了測試效果,團(tuán)隊(duì)以7名專業(yè)人類標(biāo)注員的打分為基準(zhǔn),對7種不同的圖像生成方法進(jìn)行了評估。
結(jié)果顯示DreamBench++與人類評價(jià)高度一致。
更多細(xì)節(jié)接下來一起瞅瞅~
什么是DreamBench++?DreamBench++是一個(gè)全新的評估工具,它在個(gè)性化圖像評估領(lǐng)域?qū)崿F(xiàn)了兩項(xiàng)關(guān)鍵技術(shù)突破。
引入支持多模態(tài)的GPT-4o,同時(shí)實(shí)現(xiàn)與人類偏好的深度對齊以及自動(dòng)化評估
推出了一個(gè)更為全面和多元化的數(shù)據(jù)集
與人類對齊的自動(dòng)化評估盡管GPT-4o支持多模態(tài)輸入,但在評估圖像中的細(xì)微差異時(shí)面臨挑戰(zhàn)。
原文鏈接:首次引入GPT-4o!圖像自動(dòng)評估新基準(zhǔn)來啦
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破