標簽:基準
南開&山大&北理工團隊開發trRosettaRNA:利用Transformer網絡自動預測RNA 3D結構
將 ScienceAI設為星標第一時間掌握新鮮的 AI for Science 資訊編輯 | 蘿卜皮RNA 3D 結構預測是一個長期存在的挑戰。受最近蛋白質結構預測領域突破的啟發,南...
人類考92分的題,GPT-4只能考15分:測試一升級,大模型全都現原形了
機器之心報道編輯:張倩、澤南AutoGPT 的得分也涼涼。GPT-4 自誕生以來一直是位「優等生」,在各種考試(基準)中都能得高分。但現在,它在一份新的測試中只...
OpenAI忙著“宮斗”,手握2.2萬塊H100的競爭對手趁機發布新款大模型:1750億參數,性能僅次于GPT-4
整理|冬梅、核子可樂 OpenAI 事變余波未平,競爭對手 Inflection AI 乘機發布新模型。 Inflection AI 發布新模型:5000 塊英偉達 H100 訓練、1750 億參數開...
Inflection AI推出Infection-2,性能僅次于GPT4
點擊上方藍字關注我們“ Inflection AI最新推出的AI模型Infection-2在多模態語言理解任務中表現出色,超越了業界巨頭的競爭對手,僅次于OpenAI的GPT-4。該模型...
微軟發布小型語言模型Orca 2,性能超對手
點擊上方藍字關注我們“ Microsoft發布了Orca 2,小型語言模型在復雜推理任務中表現出色,超越了大型模型。這為資源有限的企業提供了更好的選擇。同時,其他公...
13B模型全方位碾壓GPT-4?這背后有什么貓膩
機器之心報道編輯:陳萍你的測試集信息在訓練集中泄漏了嗎?一個參數量為 13B 的模型竟然打敗了頂流 GPT-4?就像下圖所展示的,并且為了確保結果的有效性,這...
老黃H100再破紀錄,4分鐘訓完GPT-3!全新「版」H20、L20和L2曝光,性能史詩級縮水
新智元報道編輯:桃子 好困【新智元導讀】英偉達H100再次刷榜了,不到4分鐘就訓完GPT-3,比6月成績提升3倍。另外,特供版H20、L20和L2性能全都爆出。H100再次...
小心你的大模型被基準評估坑了,模型直接傻掉!人大高瓴揭秘大模型作弊
夕小瑤科技說 原創作者 | 謝年年、Python從 ChatGPT 橫空出世到國內外「百模大戰」打響以來,我們隔三差五就會看到某某大模型又超越多個模型,刷新SOTA,成功...
GPT-4 Turbo獲八項測評滿分;國內最大GPU智算中心落地;Anthropic將用谷歌TPU訓練AI丨AIGC大事日報
11/09全球AIGC產業要聞1、阿里即將開源720億參數大模型2、釘釘宣布智能化底座AI PaaS全量上線3、騰訊:國內最大規模GPU智算中心落地松江4、聯想首次發布企業...
11.9丨AIGC大事日報
11/09全球AIGC產業要聞1、阿里即將開源720億參數大模型2、釘釘宣布智能化底座AI PaaS全量上線3、騰訊聯合松江落地國內最大規模GPU智算中心4、安謀科技發布“山...
大模型走捷徑「刷榜」?數據污染問題值得重視
機器之心報道機器之心編輯部我直接看答案。生成式 AI 元年,大家的工作節奏快了一大截。特別是,今年大家都在努力卷大模型:最近國內外科技巨頭、創業公司都...
別讓大模型被基準評估坑了!測試集亂入預訓練,分數虛高,模型變傻
明敏 發自 凹非寺量子位 | 公眾號 QbitAI“別讓大模型被基準評估給坑了”。這是一項最新研究的題目,來自人民大學信息學院、高瓴人工智能學院和伊利諾伊大學厄...
英偉達新超級計算機刷新紀錄,8天完成ChatGPT訓練
點擊上方藍字關注我們“ Nvidia的全新Eos AI超級計算機以前所未有的速度,在短短3.9分鐘內完成了具有1750億參數和10億標記的GPT-3模型訓練,創下了令人矚目的...
用過GPT-4 Turbo以后,我們再也回不去了
機器之心報道編輯:澤南、陳萍GPT 變得好用了,但真的更聰明了嗎??昨天,很多人徹夜未眠 —— 全球科技圈都把目光聚焦在了美國舊金山。短短 45 分鐘時間里,Op...
給大模型評分的基準靠譜嗎?Anthropic來了次大評估
選自Anthropic機器之心編譯機器之心編輯部在大模型(LLM)盛行的當下,評估 AI 系統成為了重要的一環,在評估過程中都會遇到哪些困難,Anthropic 的一篇文章...