HELM官網
HELM是由斯坦福大學推出的大模型評測體系,該評測方法主要包括場景、適配、指標三個模塊,每次評測的運行都需要指定一個場景,一個適配模型的提示,以及一個或多個指標。
網站服務:HELM,AI工具集導航。
HELM全稱Holistic Evaluation of Language Models(語言模型整體評估)是由斯坦福大學推出的大模型評測體系,該評測方法主要包括場景、適配、指標三個模塊,每次評測的運行都需要指定一個場景,一個適配模型的提示,以及一個或多個指標。它評測主要覆蓋的是英語,有7個指標,包括準確率、不確定性/校準、魯棒性、公平性、偏差、毒性、推斷效率;任務包括問答、信息檢索、摘要、文本分類等。
HELM網址入口
https://crfm.stanford.edu/helm/latest/
OpenI小編發現HELM網站非常受用戶歡迎,請訪問HELM網址入口試用。
數據評估
關于HELM特別聲明
本站OpenI提供的HELM都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2023年 11月 10日 上午6:01收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除,OpenI不承擔任何責任。
相關導航

暫無評論...