標(biāo)簽:基準(zhǔn)

南開&山大&北理工團(tuán)隊(duì)開發(fā)trRosettaRNA:利用Transformer網(wǎng)絡(luò)自動(dòng)預(yù)測(cè)RNA 3D結(jié)構(gòu)

將 ScienceAI設(shè)為星標(biāo)第一時(shí)間掌握新鮮的 AI for Science 資訊編輯 | 蘿卜皮RNA 3D 結(jié)構(gòu)預(yù)測(cè)是一個(gè)長期存在的挑戰(zhàn)。受最近蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域突破的啟發(fā),南...
閱讀原文

人類考92分的題,GPT-4只能考15分:測(cè)試一升級(jí),大模型全都現(xiàn)原形了

機(jī)器之心報(bào)道編輯:張倩、澤南AutoGPT 的得分也涼涼。GPT-4 自誕生以來一直是位「優(yōu)等生」,在各種考試(基準(zhǔn))中都能得高分。但現(xiàn)在,它在一份新的測(cè)試中只...
閱讀原文

OpenAI忙著“宮斗”,手握2.2萬塊H100的競爭對(duì)手趁機(jī)發(fā)布新款大模型:1750億參數(shù),性能僅次于GPT-4

整理|冬梅、核子可樂 OpenAI 事變余波未平,競爭對(duì)手 Inflection AI 乘機(jī)發(fā)布新模型。 Inflection AI 發(fā)布新模型:5000 塊英偉達(dá) H100 訓(xùn)練、1750 億參數(shù)開...
閱讀原文

Inflection AI推出Infection-2,性能僅次于GPT4

點(diǎn)擊上方藍(lán)字關(guān)注我們“ Inflection AI最新推出的AI模型Infection-2在多模態(tài)語言理解任務(wù)中表現(xiàn)出色,超越了業(yè)界巨頭的競爭對(duì)手,僅次于OpenAI的GPT-4。該模型...
閱讀原文

微軟發(fā)布小型語言模型Orca 2,性能超對(duì)手

點(diǎn)擊上方藍(lán)字關(guān)注我們“ Microsoft發(fā)布了Orca 2,小型語言模型在復(fù)雜推理任務(wù)中表現(xiàn)出色,超越了大型模型。這為資源有限的企業(yè)提供了更好的選擇。同時(shí),其他公...
閱讀原文

13B模型全方位碾壓GPT-4?這背后有什么貓膩

機(jī)器之心報(bào)道編輯:陳萍你的測(cè)試集信息在訓(xùn)練集中泄漏了嗎?一個(gè)參數(shù)量為 13B 的模型竟然打敗了頂流 GPT-4?就像下圖所展示的,并且為了確保結(jié)果的有效性,這...
閱讀原文

老黃H100再破紀(jì)錄,4分鐘訓(xùn)完GPT-3!全新「版」H20、L20和L2曝光,性能史詩級(jí)縮水

新智元報(bào)道編輯:桃子 好困【新智元導(dǎo)讀】英偉達(dá)H100再次刷榜了,不到4分鐘就訓(xùn)完GPT-3,比6月成績提升3倍。另外,特供版H20、L20和L2性能全都爆出。H100再次...
閱讀原文

小心你的大模型被基準(zhǔn)評(píng)估坑了,模型直接傻掉!人大高瓴揭秘大模型作弊

夕小瑤科技說 原創(chuàng)作者 | 謝年年、Python從 ChatGPT 橫空出世到國內(nèi)外「百模大戰(zhàn)」打響以來,我們隔三差五就會(huì)看到某某大模型又超越多個(gè)模型,刷新SOTA,成功...
閱讀原文

GPT-4 Turbo獲八項(xiàng)測(cè)評(píng)滿分;國內(nèi)最大GPU智算中心落地;Anthropic將用谷歌TPU訓(xùn)練AI丨AIGC大事日?qǐng)?bào)

11/09全球AIGC產(chǎn)業(yè)要聞1、阿里即將開源720億參數(shù)大模型2、釘釘宣布智能化底座AI PaaS全量上線3、騰訊:國內(nèi)最大規(guī)模GPU智算中心落地松江4、聯(lián)想首次發(fā)布企業(yè)...
閱讀原文

11.9丨AIGC大事日?qǐng)?bào)

11/09全球AIGC產(chǎn)業(yè)要聞1、阿里即將開源720億參數(shù)大模型2、釘釘宣布智能化底座AI PaaS全量上線3、騰訊聯(lián)合松江落地國內(nèi)最大規(guī)模GPU智算中心4、安謀科技發(fā)布“山...
閱讀原文

大模型走捷徑「刷榜」?數(shù)據(jù)污染問題值得重視

機(jī)器之心報(bào)道機(jī)器之心編輯部我直接看答案。生成式 AI 元年,大家的工作節(jié)奏快了一大截。特別是,今年大家都在努力卷大模型:最近國內(nèi)外科技巨頭、創(chuàng)業(yè)公司都...
閱讀原文

別讓大模型被基準(zhǔn)評(píng)估坑了!測(cè)試集亂入預(yù)訓(xùn)練,分?jǐn)?shù)虛高,模型變傻

明敏 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI“別讓大模型被基準(zhǔn)評(píng)估給坑了”。這是一項(xiàng)最新研究的題目,來自人民大學(xué)信息學(xué)院、高瓴人工智能學(xué)院和伊利諾伊大學(xué)厄...
閱讀原文

英偉達(dá)新超級(jí)計(jì)算機(jī)刷新紀(jì)錄,8天完成ChatGPT訓(xùn)練

點(diǎn)擊上方藍(lán)字關(guān)注我們“ Nvidia的全新Eos AI超級(jí)計(jì)算機(jī)以前所未有的速度,在短短3.9分鐘內(nèi)完成了具有1750億參數(shù)和10億標(biāo)記的GPT-3模型訓(xùn)練,創(chuàng)下了令人矚目的...
閱讀原文

給大模型評(píng)分的基準(zhǔn)靠譜嗎?Anthropic來了次大評(píng)估

選自Anthropic機(jī)器之心編譯機(jī)器之心編輯部在大模型(LLM)盛行的當(dāng)下,評(píng)估 AI 系統(tǒng)成為了重要的一環(huán),在評(píng)估過程中都會(huì)遇到哪些困難,Anthropic 的一篇文章...
閱讀原文
19101112