首次引入GPT-4o！圖像自動評估新基準來啦

AIGC動態1年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：首次引入GPT-4o！圖像自動評估新基準來啦
關鍵字：圖像,人類,團隊,數據,評分
文章來源：量子位
內容字數：0字

內容摘要：

DreamBench++團隊投稿量子位 | 公眾號 QbitAI面對層出不窮的個性化圖像生成技術，一個新問題擺在眼前：
缺乏統一標準來衡量這些生成的圖片是否符合人們的喜好
對此，來自清華、西交大、伊利諾伊厄巴納-香檳分校、中科院、曠視的研究人員共同推出了一項新基準DreamBench++。
通過收集不同的圖像和提示，團隊利用GPT-4o實現了符合人類偏好的自動評估。
簡單來說，通過精心設計prompt以及引入思維鏈提示，團隊讓GPT-4o在圖像評估過程中學會了像人類一樣思考，并展現其思考過程。
為了測試效果，團隊以7名專業人類標注員的打分為基準，對7種不同的圖像生成方法進行了評估。
結果顯示DreamBench++與人類評價高度一致。
更多細節接下來一起瞅瞅~
什么是DreamBench++？DreamBench++是一個全新的評估工具，它在個性化圖像評估領域實現了兩項關鍵技術突破。
引入支持多模態的GPT-4o，同時實現與人類偏好的深度對齊以及自動化評估
推出了一個更為全面和多元化的數據集
與人類對齊的自動化評估盡管GPT-4o支持多模態輸入，但在評估圖像中的細微差異時面臨挑戰。

原文鏈接：首次引入GPT-4o！圖像自動評估新基準來啦