M2RAG
用于多模態(tài)上下文中的檢索增強(qiáng)生成的基準(zhǔn)測試代碼庫。
標(biāo)簽:智能聊天機(jī)器人事實(shí)驗(yàn)證 圖像 基準(zhǔn)測試 多模態(tài) 大語言模型 檢索增強(qiáng)生成 問答M2RAG官網(wǎng)
M2RAG是一個(gè)用于多模態(tài)上下文中的檢索增強(qiáng)生成的基準(zhǔn)測試代碼庫。它通過多模態(tài)檢索文檔來回答問題,評估多模態(tài)大語言模型(MLLMs)在利用多模態(tài)上下文知識方面的能力。該模型在圖像描述、多模態(tài)問答、事實(shí)驗(yàn)證和圖像重排等任務(wù)上進(jìn)行了評估,旨在提升模型在多模態(tài)上下文學(xué)習(xí)中的有效性。M2RAG為研究人員提供了一個(gè)標(biāo)準(zhǔn)化的測試平臺,有助于推動(dòng)多模態(tài)語言模型的發(fā)展。
M2RAG是什么
M2RAG是一個(gè)用于多模態(tài)上下文中的檢索增強(qiáng)生成基準(zhǔn)測試代碼庫。它幫助研究者和開發(fā)者評估多模態(tài)大語言模型(MLLMs)在利用圖像和文本等多模態(tài)信息的能力。通過標(biāo)準(zhǔn)化的測試平臺,M2RAG促進(jìn)多模態(tài)語言模型的發(fā)展,涵蓋圖像描述、多模態(tài)問答、事實(shí)驗(yàn)證和圖像重排等任務(wù)。
M2RAG的主要功能
M2RAG的核心功能是為多模態(tài)大語言模型提供一個(gè)標(biāo)準(zhǔn)化的基準(zhǔn)測試環(huán)境。它支持多種任務(wù),包括:圖像描述(根據(jù)圖像生成描述文本)、多模態(tài)問答(根據(jù)圖像和文本信息回答問題)、事實(shí)驗(yàn)證(驗(yàn)證圖像和文本信息的一致性)以及圖像重排(根據(jù)語義對圖像進(jìn)行排序)。此外,M2RAG還提供多模態(tài)檢索增強(qiáng)指令微調(diào)(MM-RAIT)方法,以提升模型的性能。
如何使用M2RAG
M2RAG是一個(gè)開源項(xiàng)目,用戶可以通過GitHub獲取代碼和數(shù)據(jù)集。使用步驟如下:
- 克隆代碼庫:
git clone https://github.com/NEUIR/M2RAG
- 安裝依賴:根據(jù)
requirements.txt
安裝必要的Python包。 - 準(zhǔn)備數(shù)據(jù)集:下載M2RAG數(shù)據(jù)集或自行構(gòu)建,并放置在
data
文件夾中。 - 編碼測試集查詢和多模態(tài)語料庫:運(yùn)行
script/get_embed_test.sh
。 - 檢索最相關(guān)的多模態(tài)文檔:運(yùn)行
script/retrieval_test.sh
。 - 使用檢索到的文檔進(jìn)行零樣本推理:運(yùn)行
script/inference_cpmv.sh
或script/inference_qwen.sh
。 - 圖像重排任務(wù)評估:運(yùn)行
script/compute_ppl_minicpmv.sh
或script/compute_ppl_qwen2vl.sh
。 - 使用
src/evaluation
中的腳本評估生成任務(wù)的性能。
M2RAG兼容多種預(yù)訓(xùn)練模型,如MiniCPM-V 2.6和Qwen2-VL,并支持零樣本和微調(diào)兩種設(shè)置。
M2RAG的產(chǎn)品價(jià)格
M2RAG是一個(gè)開源項(xiàng)目,完全免費(fèi)。
M2RAG常見問題
M2RAG支持哪些類型的多模態(tài)數(shù)據(jù)? M2RAG目前主要支持圖像和文本數(shù)據(jù)的結(jié)合。
如果我的數(shù)據(jù)集與M2RAG提供的不同,該如何處理? M2RAG的代碼設(shè)計(jì)具有較好的擴(kuò)展性,你可以根據(jù)自己的數(shù)據(jù)集修改代碼中的數(shù)據(jù)加載和預(yù)處理部分。
M2RAG的評估指標(biāo)有哪些? M2RAG提供多種評估指標(biāo),具體取決于不同的任務(wù),例如圖像描述任務(wù)可能使用BLEU或ROUGE分?jǐn)?shù),而多模態(tài)問答任務(wù)可能使用準(zhǔn)確率和F1分?jǐn)?shù)等。
M2RAG官網(wǎng)入口網(wǎng)址
https://github.com/NEUIR/M2RAG
OpenI小編發(fā)現(xiàn)M2RAG網(wǎng)站非常受用戶歡迎,請?jiān)L問M2RAG網(wǎng)址入口試用。
數(shù)據(jù)統(tǒng)計(jì)
數(shù)據(jù)評估
本站OpenI提供的M2RAG都來源于網(wǎng)絡(luò),不保證外部鏈接的準(zhǔn)確性和完整性,同時(shí),對于該外部鏈接的指向,不由OpenI實(shí)際控制,在2025年 3月 17日 下午7:46收錄時(shí),該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進(jìn)行刪除,OpenI不承擔(dān)任何責(zé)任。