自動(dòng)化、可復(fù)現(xiàn),基于大語(yǔ)言模型群體智能的多維評(píng)估基準(zhǔn)Decentralized Arena來了
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:自動(dòng)化、可復(fù)現(xiàn),基于大語(yǔ)言模型群體智能的多維評(píng)估基準(zhǔn)Decentralized Arena來了
關(guān)鍵字:模型,報(bào)告,維度,問題,基準(zhǔn)
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.comMaitrix.org 是由 UC San Diego, John Hopkins University, CMU, MBZUAI 等學(xué)術(shù)機(jī)構(gòu)學(xué)者組成的開源組織,致力于發(fā)展大語(yǔ)言模型 (LLM)、世界模型 (World Model)、智能體模型 (Agent Model) 的技術(shù)以構(gòu)建 AI 驅(qū)動(dòng)的現(xiàn)實(shí)。Maitrix.org 此前成功開發(fā)了 Pandora 視頻-語(yǔ)言世界模型、LLM Reasoners,以及 MMToM-QA 評(píng)測(cè)(ACL 2024 Outstanding Paper Award)。
研究者們已經(jīng)并陸續(xù)構(gòu)建了成千上萬的大規(guī)模語(yǔ)言模型(LLM),這些模型的各項(xiàng)能力(如推理和生成)也越來越強(qiáng)。因此,在多樣的應(yīng)用場(chǎng)景中對(duì)其進(jìn)行性能基準(zhǔn)測(cè)試已成為了
原文鏈接:自動(dòng)化、可復(fù)現(xiàn),基于大語(yǔ)言模型群體智能的多維評(píng)估基準(zhǔn)Decentralized Arena來了
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡(jiǎn)介: