標(biāo)簽:測試

GPT-4和DALL·E 3徹底懵逼,這到底是「牛」還是「鯊」

夕小瑤科技說 原創(chuàng)作者 | 付奶茶、王二狗大離譜!我用GPT-4(V)和DALL·E 3 「混合雙打」之下,生成了一張張 牛鯊??圖,那么問題來了,這到底是牛還是鯊?起因...
閱讀原文

ChatGPT多模態(tài)解禁,網(wǎng)友玩瘋!拍圖即生代碼,古卷手稿一眼識別,圖表總結(jié)超6

新智元報道編輯:桃子【新智元導(dǎo)讀】ChatGPT多模態(tài)能力終于可以嘗鮮了!這周三,OpenAI剛剛宣布解禁ChatGPT多模態(tài)能力。如今,一上線,網(wǎng)友們瞬間玩瘋了。接...
閱讀原文

對 GPT-4V(ision) 的第一印象

圖文|James Gallagher, Piotr Skalski翻譯|匡萃彪在這個指南中,我們將分享我們對GPT-4V圖像輸入功能的第一印象。我們將進(jìn)行一系列實驗,測試GPT-4V的功能...
閱讀原文

英偉達(dá)新王者登場!GH200超級芯片碾壓H100,性能飆升17%!

夕小瑤科技說 分享來源 | 新智元繼4月份加入LLM訓(xùn)練測試后,MLPerf再次迎來重磅更新!剛剛,MLCommons發(fā)布了MLPerf v3.1版本更新,并加入了兩個全新基準(zhǔn):LLM...
閱讀原文

ICCV 2023 Oral | 如何在開放世界進(jìn)行測試段訓(xùn)練?基于動態(tài)原型擴(kuò)展的自訓(xùn)練方法

機(jī)器之心報道機(jī)器之心編輯部本文首次提出一種針對開放世界的測試段訓(xùn)練方法。提高模型泛化能力是推動基于視覺的感知方法落地的重要基礎(chǔ),測試段訓(xùn)練和適應(yīng)(T...
閱讀原文

碾壓H100!英偉達(dá)GH200超級芯片首秀MLPerf v3.1,性能躍升17%

新智元報道編輯:編輯部【新智元導(dǎo)讀】傳說中的英偉達(dá)GH200在MLPerf 3.1中驚艷亮相,性能直接碾壓H100,領(lǐng)先了17%。繼4月份加入LLM訓(xùn)練測試后,MLPerf再次迎...
閱讀原文

OpenAI:LLM能感知自己在被測試,為了通過會隱藏信息人類|附應(yīng)對措施

新智元報道編輯:潤【新智元導(dǎo)讀】OpenAI,紐大,牛津大學(xué)等研究人員發(fā)現(xiàn),LLM能夠感知自身所處的情景。研究人員通過實驗可以提前預(yù)知和觀察這種感知能力。AI...
閱讀原文

圖靈測試已死!ChatGPT通過人類考試也不算,超強(qiáng)AI評估新秀「邏輯謎題」

新智元報道編輯:桃子【新智元導(dǎo)讀】如何給大模型一個真正公平評價標(biāo)準(zhǔn)呢?世界最強(qiáng)AI——ChatGPT可以通過各種考試,甚至輸出回答讓人難以辨別真假。然而,它也...
閱讀原文
1111213