MMLU官網(wǎng)
MMLU 全稱 Massive Multitask Language Understanding,是一種針對大模型的語言理解能力的測評,是目前最著名的大模型語義理解測評之一,由UC Berkeley大學的研究人員在2020年9月推出。
網(wǎng)站服務:MMLU,AI工具集導航。
The current state-of-the-art on MMLU is GPT-4 (few-shot, k=5). See a full comparison of 77 papers with code.
MMLU 全稱 Massive Multitask Language Understanding,是一種針對大模型的語言理解能力的測評,是目前最著名的大模型語義理解測評之一,由UC Berkeley大學的研究人員在2020年9月推出。該測試涵蓋57項任務,包括初等數(shù)學、美國歷史、計算機科學、法律等。任務涵蓋的知識很廣泛,語言是英文,用以評測大模型基本的知識覆蓋范圍和理解能力。
MMLU網(wǎng)址入口
https://paperswithcode.com/sota/multi-task-language-understanding-on-mmlu
OpenI小編發(fā)現(xiàn)MMLU網(wǎng)站非常受用戶歡迎,請訪問MMLU網(wǎng)址入口試用。
數(shù)據(jù)評估
本站OpenI提供的MMLU都來源于網(wǎng)絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2023年 11月 10日 上午6:00收錄時,該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進行刪除,OpenI不承擔任何責任。