標簽:測試

Llama 3每秒輸出800個token逼宮openAI!下周奧特曼生日或放出GPT-5?

新智元報道編輯:桃子 Lumina 【新智元導讀】Llama 3的開源,或將催生數十億美元新產業。發布不到一周的時間,全網各種測試微調都開啟了。甚至,Llama 3在Gro...
閱讀原文

史上首次!AI駕駛戰機成功與人類飛行員空中「狗斗」

機器之心報道 編輯:杜偉遺憾的是,這場「人機空戰」的勝負結果未知。AI 操縱的戰斗機又一次進化了! 近日,美國 DARPA 透露稱,去年 9 月一架由 F-16 改裝而...
閱讀原文

開源模型越來越落后?Meta甩出全新Llama 3應戰|甲子光年

一頭狂奔中睥睨對手的羊駝。作者|蘇霍伊 編輯|王博如同悶了很久,突然下的一場雨——Llama 3終于來了。 美國當地時間4月18日,Meta公司推出其開源大語言模型“...
閱讀原文

馬斯克旗下xAI發布首個多模態大模型!

大數據文摘受權轉載自頭部科技 文丨Congerry 3月中旬,馬斯克旗下的 xAI 剛剛宣布開源 Grok-1 大模型! 一個月過去,xAI 又掏出了 Grok-1.5V。 Grok-1.5V是xA...
閱讀原文

ChatGPT 大更新! GPT-4 今天開始又變聰明了

ChatGPT 變聰明了就在剛剛,OpenAI 官方宣布,新版 GPT-4 Turbo 今天開始向所有付費 ChatGPT 用戶開放。 如果知識庫截止時間已經更新為 2024 年 4 月,那說明...
閱讀原文

馬斯克的Grok在安全測試中墊底,Llama 獨占鰲頭

點擊上方藍字關注我們“安全研究人員發現,埃隆·馬斯克的 Grok AI 聊天機器人在越獄攻擊中的安全性最弱,而 Meta 的 Llama 則相對安全。越獄是指規避軟件開發...
閱讀原文

GPT-5紅隊測試郵件曝光,最早6月發布?網友在線逼問Altman,數十億美元超算26年啟動

新智元報道編輯:Aeneas 桃子 【新智元導讀】今天,陸續有網友曬出OpenAI發給自己的紅隊邀請郵件,看起來,GPT-5已經進入紅隊測試了?網友們紛紛展開暢想,對...
閱讀原文

華盛頓大學撰文反駁微軟,我們無法刪除大模型關于哈利波特的記憶

夕小瑤科技說 原創作者 | Tscom引言:探索記憶消除的界限在人工智能的發展過程中,一個引人入勝的議題是機器學習模型是否能夠被訓練以忘記其曾經學到的信息。...
閱讀原文

“大海撈針”out!“數星星”成測長文本能力更精準方法,來自鵝廠

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI大模型長文本能力測試,又有新方法了! 騰訊MLPD實驗室,用全新開源的“數星星”方法替代了傳統的“大海撈針”測試。 ...
閱讀原文

大模型實時打《街霸》捉對PK,GPT-4居然不敵3.5,新型Benchmark火了

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI讓大模型直接操縱格斗游戲《街霸》里的角色,捉對PK,誰更能打? GitHub上一種你沒有見過的船新Benchmark火了。 與ll...
閱讀原文

谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇

新智元報道編輯:編輯部 【新智元導讀】JAX在最近的基準測試中的性能已經不聲不響地超過了Pytorch和TensorFlow,也許未來會有更多的大模型誕生在這個平臺上。...
閱讀原文

馬斯克官宣Grok-1.5!超GPT-4?16倍上下文,推理能力超DBRX,網友:贏在敢說!

作者 | 李忠良、褚杏娟、核子可樂引言:還記得 3 月 18 日,馬斯克開源 Grok 的那一刻嗎?如今,Grok 1.5 即將登場,其卓越的編碼與數學處理能力、更深入的上...
閱讀原文

3個月砸1000萬美元肝出“最強”大模型?黑馬Databricks:我們完虐Grok、Llama,還更開放

整理 | 凌敏、核子可樂 世界最強開源大模型又雙叒叕易主了! Databricks 推出開源大模型 DBRX 3 月 27 日,美國 AI 初創公司 Databricks 宣布,該公司 Mosaic...
閱讀原文

最新爆料!GPT-5已有客戶上手體驗:性能驚人,或將在夏天發布

新智元報道編輯:潤 好困 【新智元導讀】外媒曝出,OpenAI已經向客戶提供GPT-5的體驗版本,紅隊測試已經在進行當中,最快今年夏天面世!GPT-5真的要來了,已...
閱讀原文

全球首個AI程序員當老板!IOI金牌得主全部工作AI掌盤,技術細節報告公開

新智元報道編輯:桃子 【新智元導讀】一夜之間,全球首個AI程序員的誕生碼農的世界變了天。更讓人震驚的是,現在的Devin還成為Cognition AI的首席執行官替身...
閱讀原文
16789109,365