標(biāo)簽:測試

SearchGPT第一波評測來了!響應(yīng)速度超快還沒廣告,“OpenAI锏”

克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAIOpenAI這次終于不放衛(wèi)星了—— 最新發(fā)布的SearchGPT,已經(jīng)有第一波嘗鮮者展示了自己的體驗(yàn)。 據(jù)做測試的博主介紹,Se...
閱讀原文

OpenAI慘遭打臉!SearchGPT官方演示大翻車,源代碼竟暴露搜索機(jī)制

新智元報(bào)道編輯:桃子 喬楊 【新智元導(dǎo)讀】OpenAI再次上演了谷歌Bard出糗的一幕,SearchGPT官方震撼演示卻被外媒曝出低級錯(cuò)誤。另有神通廣大的開發(fā)者甚至扒出...
閱讀原文

人工智能時(shí)代,學(xué)校的標(biāo)準(zhǔn)化選拔還有效嗎?

去年,全球人工智能領(lǐng)域著名華人科學(xué)家李飛飛在一次公開演講中說道:“從我在斯坦福大學(xué)任教以來,我一直對大學(xué)的招生辦公室感到好奇。終于有一天,他們想找我...
閱讀原文

專治大模型“刷題”!賈佳亞團(tuán)隊(duì)新基準(zhǔn)讓模型只挑錯(cuò)不做題,GPT-4得分不到50

MR-Ben團(tuán)隊(duì) 投稿量子位 | 公眾號 QbitAI大模型測試能拿高分,實(shí)際場景中卻表現(xiàn)不佳的問題有解了。 賈佳亞團(tuán)隊(duì)聯(lián)合多家知名高校提出了一種全新的測評方法,讓...
閱讀原文

Claude更新王炸功能:一鍵生成、評估、優(yōu)化提示詞!

直播預(yù)告 | 7月23日14點(diǎn),「智猩猩在線研討會(huì) NVIDIA AI for Science 專場」將開講,兩位專家將分別以《AI 驅(qū)動(dòng)下的新能源材料研究與發(fā)現(xiàn)》、《NVIDIA Modulu...
閱讀原文

人工智能紅隊(duì)測試為何會(huì)出錯(cuò)

一種對抗性的網(wǎng)絡(luò)安全工具被過度用于保護(hù)人工智能安全。2024年2月,OpenAI宣布推出Sora,這是一款令人驚嘆的“文本轉(zhuǎn)視頻”工具。只需要輸入一個(gè)提示,Sora就能...
閱讀原文

英國劍橋大學(xué)開發(fā)AI工具,老年癡呆癥預(yù)測準(zhǔn)確率比標(biāo)準(zhǔn)高三倍!

夕小瑤科技說 原創(chuàng)作者 | 21# 近日,劍橋大學(xué)心理學(xué)系的科學(xué)家團(tuán)隊(duì)開發(fā)了一種AI模型,能夠預(yù)測患有輕度記憶和思維問題的個(gè)體是否以及多快會(huì)發(fā)展為阿爾茨海默...
閱讀原文

短期內(nèi)用戶量 10 倍增長,「用戶引導(dǎo)」驅(qū)動(dòng)下的 PLG 實(shí)操復(fù)盤

「與 99% 的財(cái)富 100 強(qiáng)企業(yè)」合作的可視化協(xié)作平臺(tái) Miro 曾在疫情期間快速實(shí)現(xiàn) 10 倍用戶增長。 Miro 將「協(xié)作」視為核心價(jià)值,核心功能可以總結(jié)為一句話:...
閱讀原文

這些VLM竟都是盲人?GPT-4o、Sonnet-3.5相繼敗于「視力」測試

機(jī)器之心報(bào)道 機(jī)器之心編輯部四大 VLM,竟都在盲人摸象? 讓現(xiàn)在最火的 SOTA 模型們(GPT-4o,Gemini-1.5,Sonnet-3,Sonnet-3.5)數(shù)一數(shù)兩條線有幾個(gè)交點(diǎn),...
閱讀原文

Claude上新:一鍵生成、測試和評估prompt,讓 prompt 寫作零門檻!

文章轉(zhuǎn)載自「機(jī)器之心」。 在構(gòu)建 AI 應(yīng)用時(shí),prompt 質(zhì)量對結(jié)果有著重大影響。但制作高質(zhì)量的 prompt 具有挑戰(zhàn)性,需要研究者深入了解應(yīng)用需求,并具備大型...
閱讀原文

人人可做提示工程師!Claude上新:一鍵生成、測試和評估prompt

機(jī)器之心報(bào)道 編輯:陳陳、小舟不會(huì)寫 prompt 的看過來。在構(gòu)建 AI 應(yīng)用時(shí),prompt 質(zhì)量對結(jié)果有著重大影響。但制作高質(zhì)量的 prompt 具有挑戰(zhàn)性,需要研究者...
閱讀原文

又一家技術(shù)+產(chǎn)品雙殺的大模型創(chuàng)業(yè)公司!一款測試,讓其WAIC大會(huì)展位火爆

夕小瑤科技說 原創(chuàng)作者 | 夕小瑤編輯部最近上海世界人工智能大會(huì)(WAIC)現(xiàn)場,一個(gè)國風(fēng)展位前排起了長長的隊(duì)伍,筆者忍不住好奇,究竟是什么新奇的東西吸引...
閱讀原文

學(xué)術(shù)前沿 | Transformer究竟如何推理?基于樣例還是基于規(guī)則

來源:北京大學(xué)人工智能研究院 導(dǎo)讀本文是對發(fā)表于ICML 2024的論文Case-based or rule-based: How Do Transformers Do the Math?的解讀。文章第一作者為來自...
閱讀原文

菲爾茲獎(jiǎng)得主親測GPT-4o,經(jīng)典過河難題失敗!最強(qiáng)Claude 3.5回答離譜,LeCun嘲諷LLM

新智元報(bào)道編輯:桃子 喬楊 【新智元導(dǎo)讀】LLM能否解決「狼-山羊-卷心菜」經(jīng)典過河難題?最近,菲爾茲獎(jiǎng)得主Timothy Gowers分享了實(shí)測GPT-4o的過程,模型在最...
閱讀原文

ICML 2024|Transformer究竟如何推理?基于樣例還是基于規(guī)則

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文
13456710,017