AIGC動態歡迎閱讀
原標題:這就翻車了?Reflection 70B遭質疑基模為Llama 3,作者:重新訓練
關鍵字:模型,權重,基準,開發者,表示
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
編輯:杜偉最近,開源大模型社區再次「熱鬧」了起來,主角是 AI 寫作初創公司 HyperWrite 開發的新模型 Reflection 70B。
它的底層模型建立在 Meta Llama 3.1 70B Instruct 上,并使用原始的 Llama chat 格式,確保了與現有工具和 pipeline 的兼容性。
這個模型橫掃了 MMLU、MATH、IFEval、GSM8K,在每項基準測試上都超過了 GPT-4o,還擊敗了 405B 的 Llama 3.1。憑借如此驚艷的效果,Reflection70B被冠以開源大模型新王。該模型更是由兩位開發者(HyperWrite CEO Matt Shumer 和 Glaive AI 創始人 Sahil Chaudhary)花了 3 周完成,效率可謂驚人。
Reflection 70B 能不能經受住社區的考驗呢?今天 AI 模型分析機構 Artificial Analysis 進行了評估測試,結果有點出乎意料。
該機構表示,Reflection Llama 3.1 70B 的 MMLU 得分僅與 Llama 3 70B 相
原文鏈接:這就翻車了?Reflection 70B遭質疑基模為Llama 3,作者:重新訓練
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...