AIGC動態歡迎閱讀
內容摘要:
DreamBench++團隊 投稿量子位 | 公眾號 QbitAI面對層出不窮的個性化圖像生成技術,一個新問題擺在眼前:
缺乏統一標準來衡量這些生成的圖片是否符合人們的喜好
對此,來自清華、西交大、伊利諾伊厄巴納-香檳分校、中科院、曠視的研究人員共同推出了一項新基準DreamBench++。
通過收集不同的圖像和提示,團隊利用GPT-4o實現了符合人類偏好的自動評估。
簡單來說,通過精心設計prompt以及引入思維鏈提示,團隊讓GPT-4o在圖像評估過程中學會了像人類一樣思考,并展現其思考過程。
為了測試效果,團隊以7名專業人類標注員的打分為基準,對7種不同的圖像生成方法進行了評估。
結果顯示DreamBench++與人類評價高度一致。
更多細節接下來一起瞅瞅~
什么是DreamBench++?DreamBench++是一個全新的評估工具,它在個性化圖像評估領域實現了兩項關鍵技術突破。
引入支持多模態的GPT-4o,同時實現與人類偏好的深度對齊以及自動化評估
推出了一個更為全面和多元化的數據集
與人類對齊的自動化評估盡管GPT-4o支持多模態輸入,但在評估圖像中的細微差異時面臨挑戰。
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...