標(biāo)簽:基準(zhǔn)
跨平臺(tái)多模態(tài)智能體基準(zhǔn)測(cè)試來了!但全班第一只考了35.26分
新智元報(bào)道編輯:alan 好困 【新智元導(dǎo)讀】近日,來自CAMEL AI、KAUST、CMU、斯坦福、清華等高校和機(jī)構(gòu)的研究人員推出了一個(gè)跨平臺(tái)的多模態(tài)智能體基準(zhǔn)測(cè)試,...
Meta 科學(xué)家揭秘 Llama 3.1:合成數(shù)據(jù)很重要,MoE 不是必須的
剛剛發(fā)布的開源「巨無霸」Llama 3.1 雖然自帶論文,但依舊激起了廣大網(wǎng)友強(qiáng)烈的好奇心和求知欲。 Llama 3.1 都使用了哪些數(shù)據(jù)?其中有多少合成數(shù)據(jù)?為什么不...
Llama 4訓(xùn)練已開啟!Meta科學(xué)家最新采訪,揭秘Llama 3.1是如何煉成的
新智元報(bào)道編輯:?jiǎn)虠?【新智元導(dǎo)讀】最近,Latent Space發(fā)布的播客節(jié)目中請(qǐng)來了Meta的AI科學(xué)家Thomas Scialom。他在節(jié)目中揭秘了Llama 3.1的一些研發(fā)思路,...
賈揚(yáng)清點(diǎn)贊:3K star量的SGLang上新,加速Llama 405B推理秒殺vLLM、TensorRT-LLM
機(jī)器之心報(bào)道 編輯:張倩用來運(yùn)行 Llama 3 405B 優(yōu)勢(shì)明顯。 最近,Meta 開源了最新的 405B 模型(Llama 3.1 405B),把開源模型的性能拉到了新高度。由于模型...
萬億token!史上最大多模態(tài)數(shù)據(jù)集誕生
機(jī)器之心報(bào)道 編輯:Panda W開源多模態(tài)大模型或?qū)㈤_始騰飛。值此 Llama 3.1 占領(lǐng)各大頭條之際,又突然冒出了另一個(gè)也非常重要的發(fā)布 —— 一個(gè)規(guī)模空前的開源多...
Mistral AI新旗艦?zāi)P吞魬?zhàn)Llama 3.1!1230億參數(shù)性能直逼GPT-4o
Mistral AI新旗艦?zāi)P椭匕醢l(fā)布:“幻覺”控制出色。 編譯|孟強(qiáng) 編輯|云鵬 智東西7月25日消息,繼Meta昨日推出開源Llama3.1模型之后,法國(guó)初創(chuàng)AI公司Mistral AI...
兩天內(nèi),Meta 和 Mistral 兩款主流大模型打擂臺(tái)!已經(jīng)不僅卷性能了,誰更便宜就用誰?
來源:AI前線 整理:冬梅、核子可樂Mistral 發(fā)布開源旗艦?zāi)P停?參數(shù)更小但性能不打折 對(duì)于前沿人工智能模型領(lǐng)域來說,這兩天可謂熱鬧非凡,AI 科技競(jìng)賽正在...
Mistral新旗艦決戰(zhàn)Llama 3.1!最強(qiáng)開源Large 2 123B,扛鼎多語言編程全能王
新智元報(bào)道編輯: 【新智元導(dǎo)讀】緊跟著Meta的重磅發(fā)布,Mistral Large 2也帶著權(quán)重一起上新了,而且參數(shù)量?jī)H為L(zhǎng)lama 3.1 405B的三分之一。不僅在編碼、數(shù)學(xué)...
蘋果開源7B大模型,訓(xùn)練過程數(shù)據(jù)集一口氣全給了,網(wǎng)友:開放得不像蘋果
一水 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI蘋果最新殺入開源大模型戰(zhàn)場(chǎng),而且比其他公司更開放。 推出7B模型,不僅效果與Llama 3 8B相當(dāng),而且一次性開源了全部...
權(quán)重、代碼、數(shù)據(jù)集全開源,性能超越Mistral-7B,蘋果小模型來了
機(jī)器之心報(bào)道 機(jī)器之心編輯部小模型成趨勢(shì)?本周,OpenAI 上線小模型 GPT-4o-mini,小模型賽道正式開卷。近期加入這一賽道的還有蘋果。 最近,蘋果公司作為 D...
Mamba寫代碼真的超越Transformer!原始論文入選頂流新會(huì)議
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI“歐洲OpenAI”和“Transformer挑戰(zhàn)者”強(qiáng)強(qiáng)聯(lián)合了! Mistral AI剛剛推出了其第一個(gè)基于Mamba2架構(gòu)的開源模型——Codestral...
原作親自下場(chǎng)!Mistral首款開源7B Mamba模型「埃及艷后」效果驚艷
新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】最近,7B小模型又成為了AI巨頭們競(jìng)相追趕的潮流。繼谷歌的Gemma2 7B后,Mistral今天又發(fā)布了兩個(gè)7B模型,分別是針對(duì)ST...
Llama3比GPT-4o更愛說謊,首個(gè)大模型“誠(chéng)實(shí)性”評(píng)估基準(zhǔn)來了 | 上海交大
Pengfei Liu 投稿量子位 | 公眾號(hào) QbitAI評(píng)估大模型是否誠(chéng)實(shí)的基準(zhǔn)來了! 上海交通大學(xué)生成式人工智能實(shí)驗(yàn)室(GAIR Lab)推出了一項(xiàng)開創(chuàng)性的評(píng)估基準(zhǔn)——BeHone...
大模型時(shí)代的藍(lán)海任務(wù),GPT4V準(zhǔn)確率不足10%,港科大發(fā)布指代理解基準(zhǔn)RefCOCO
夕小瑤科技說 原創(chuàng)作者 | 謝年年談到多模態(tài)大模型的應(yīng)用場(chǎng)景,除了生成任務(wù)以外,應(yīng)用最廣泛的可能就是在圖像和視頻中進(jìn)行目標(biāo)檢測(cè)。 目標(biāo)檢測(cè)要求從圖像中識(shí)...
上交舉辦“大模型奧林匹克競(jìng)賽”,GPT-4o僅得39分
夕小瑤科技說 原創(chuàng)作者 | 謝年年大模型的奧林匹克競(jìng)賽來了! 最近,上交構(gòu)建了一個(gè)全面、極具挑戰(zhàn)性的奧賽級(jí)別的基準(zhǔn)——OlympicArena,從來自62個(gè)不同奧林匹克...