CMMLU官網(wǎng)
CMMLU是一個綜合性的中文評估基準(zhǔn),專門用于評估語言模型在中文語境下的知識和推理能力,涵蓋了從基礎(chǔ)學(xué)科到高級專業(yè)水平的67個主題。
網(wǎng)站服務(wù):CMMLU,AI工具集導(dǎo)航。
CMMLU是一個綜合性的中文評估基準(zhǔn),專門用于評估語言模型在中文語境下的知識和推理能力,涵蓋了從基礎(chǔ)學(xué)科到高級專業(yè)水平的67個主題。它包括:需要計算和推理的自然科學(xué),需要知識的人文科學(xué)和社會科學(xué),以及需要生活常識的中國駕駛規(guī)則等。此外,CMMLU中的許多任務(wù)具有中國特定的答案,可能在其他地區(qū)或語言中并不普遍適用。因此是一個完全中國化的中文測試基準(zhǔn)。
CMMLU網(wǎng)址入口
https://github.com/haonan-li/CMMLU/
OpenI小編發(fā)現(xiàn)CMMLU網(wǎng)站非常受用戶歡迎,請訪問CMMLU網(wǎng)址入口試用。
數(shù)據(jù)評估
本站OpenI提供的CMMLU都來源于網(wǎng)絡(luò),不保證外部鏈接的準(zhǔn)確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2023年 11月 10日 上午6:01收錄時,該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進(jìn)行刪除,OpenI不承擔(dān)任何責(zé)任。
相關(guān)導(dǎo)航

LLMEval3官網(wǎng)入口網(wǎng)址,LLMEval是由復(fù)旦大學(xué)NLP實驗室推出的大模型評測基準(zhǔn),最新的LLMEval-3聚焦于專業(yè)知識能力評測,涵蓋哲學(xué)、經(jīng)濟(jì)學(xué)、法學(xué)、教育學(xué)、文學(xué)、歷史學(xué)、理學(xué)、工學(xué)、農(nóng)學(xué)、醫(yī)學(xué)、軍事學(xué)、管理學(xué)、藝術(shù)學(xué)等教育部劃定的13個學(xué)科門類、50余個二級學(xué)科,共計約20W道標(biāo)準(zhǔn)生成式問答題目。