M2RAG
用于多模態(tài)上下文中的檢索增強(qiáng)生成的基準(zhǔn)測(cè)試代碼庫(kù)。
標(biāo)簽:智能聊天機(jī)器人事實(shí)驗(yàn)證 圖像 基準(zhǔn)測(cè)試 多模態(tài) 大語(yǔ)言模型 檢索增強(qiáng)生成 問(wèn)答M2RAG官網(wǎng)
M2RAG是一個(gè)用于多模態(tài)上下文中的檢索增強(qiáng)生成的基準(zhǔn)測(cè)試代碼庫(kù)。它通過(guò)多模態(tài)檢索文檔來(lái)回答問(wèn)題,評(píng)估多模態(tài)大語(yǔ)言模型(MLLMs)在利用多模態(tài)上下文知識(shí)方面的能力。該模型在圖像描述、多模態(tài)問(wèn)答、事實(shí)驗(yàn)證和圖像重排等任務(wù)上進(jìn)行了評(píng)估,旨在提升模型在多模態(tài)上下文學(xué)習(xí)中的有效性。M2RAG為研究人員提供了一個(gè)標(biāo)準(zhǔn)化的測(cè)試平臺(tái),有助于推動(dòng)多模態(tài)語(yǔ)言模型的發(fā)展。
M2RAG是什么
M2RAG是一個(gè)用于多模態(tài)上下文中的檢索增強(qiáng)生成基準(zhǔn)測(cè)試代碼庫(kù)。它幫助研究者和開(kāi)發(fā)者評(píng)估多模態(tài)大語(yǔ)言模型(MLLMs)在利用圖像和文本等多模態(tài)信息的能力。通過(guò)標(biāo)準(zhǔn)化的測(cè)試平臺(tái),M2RAG促進(jìn)多模態(tài)語(yǔ)言模型的發(fā)展,涵蓋圖像描述、多模態(tài)問(wèn)答、事實(shí)驗(yàn)證和圖像重排等任務(wù)。

M2RAG的主要功能
M2RAG的核心功能是為多模態(tài)大語(yǔ)言模型提供一個(gè)標(biāo)準(zhǔn)化的基準(zhǔn)測(cè)試環(huán)境。它支持多種任務(wù),包括:圖像描述(根據(jù)圖像生成描述文本)、多模態(tài)問(wèn)答(根據(jù)圖像和文本信息回答問(wèn)題)、事實(shí)驗(yàn)證(驗(yàn)證圖像和文本信息的一致性)以及圖像重排(根據(jù)語(yǔ)義對(duì)圖像進(jìn)行排序)。此外,M2RAG還提供多模態(tài)檢索增強(qiáng)指令微調(diào)(MM-RAIT)方法,以提升模型的性能。
如何使用M2RAG
M2RAG是一個(gè)開(kāi)源項(xiàng)目,用戶(hù)可以通過(guò)GitHub獲取代碼和數(shù)據(jù)集。使用步驟如下:
- 克隆代碼庫(kù):
git clone https://github.com/NEUIR/M2RAG - 安裝依賴(lài):根據(jù)
requirements.txt安裝必要的Python包。 - 準(zhǔn)備數(shù)據(jù)集:下載M2RAG數(shù)據(jù)集或自行構(gòu)建,并放置在
data文件夾中。 - 編碼測(cè)試集查詢(xún)和多模態(tài)語(yǔ)料庫(kù):運(yùn)行
script/get_embed_test.sh。 - 檢索最相關(guān)的多模態(tài)文檔:運(yùn)行
script/retrieval_test.sh。 - 使用檢索到的文檔進(jìn)行零樣本推理:運(yùn)行
script/inference_cpmv.sh或script/inference_qwen.sh。 - 圖像重排任務(wù)評(píng)估:運(yùn)行
script/compute_ppl_minicpmv.sh或script/compute_ppl_qwen2vl.sh。 - 使用
src/evaluation中的腳本評(píng)估生成任務(wù)的性能。
M2RAG兼容多種預(yù)訓(xùn)練模型,如MiniCPM-V 2.6和Qwen2-VL,并支持零樣本和微調(diào)兩種設(shè)置。
M2RAG的產(chǎn)品價(jià)格
M2RAG是一個(gè)開(kāi)源項(xiàng)目,完全免費(fèi)。
M2RAG常見(jiàn)問(wèn)題
M2RAG支持哪些類(lèi)型的多模態(tài)數(shù)據(jù)? M2RAG目前主要支持圖像和文本數(shù)據(jù)的結(jié)合。
如果我的數(shù)據(jù)集與M2RAG提供的不同,該如何處理? M2RAG的代碼設(shè)計(jì)具有較好的擴(kuò)展性,你可以根據(jù)自己的數(shù)據(jù)集修改代碼中的數(shù)據(jù)加載和預(yù)處理部分。
M2RAG的評(píng)估指標(biāo)有哪些? M2RAG提供多種評(píng)估指標(biāo),具體取決于不同的任務(wù),例如圖像描述任務(wù)可能使用BLEU或ROUGE分?jǐn)?shù),而多模態(tài)問(wèn)答任務(wù)可能使用準(zhǔn)確率和F1分?jǐn)?shù)等。
M2RAG官網(wǎng)入口網(wǎng)址
https://github.com/NEUIR/M2RAG
OpenI小編發(fā)現(xiàn)M2RAG網(wǎng)站非常受用戶(hù)歡迎,請(qǐng)?jiān)L問(wèn)M2RAG網(wǎng)址入口試用。
數(shù)據(jù)評(píng)估
本站OpenI提供的M2RAG都來(lái)源于網(wǎng)絡(luò),不保證外部鏈接的準(zhǔn)確性和完整性,同時(shí),對(duì)于該外部鏈接的指向,不由OpenI實(shí)際控制,在2025年 3月 17日 下午7:46收錄時(shí),該網(wǎng)頁(yè)上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁(yè)的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進(jìn)行刪除,OpenI不承擔(dān)任何責(zé)任。



粵公網(wǎng)安備 44011502001135號(hào)