AIGC動態歡迎閱讀
原標題:OpenAI掀小模型血戰!蘋果DCLM強勢登場,碾壓Mistral 7B全開源
關鍵字:模型,數據,權重,蘋果,任務
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:桃子 喬楊
【新智元導讀】小模型時代來了?OpenAI帶著GPT-4o mini首次入局小模型戰場,Mistral AI、HuggingFace本周接布了小模型。如今,蘋果也發布了70億參數小模型DCLM,性能碾壓Mistral-7B。小模型的戰場,打起來了!
繼GPT-4o mini、Mistral NeMo發布之后,蘋果也入局了。
DCLM小模型包含兩種參數規模——70億和14億,發布即開源。最大70億參數超越了Mistral-7B ,性能接近Llama 3、Gemma。
根據蘋果ML小組研究科學家Vaishaal Shankar(也是DCLM研發人員)的說法,這是迄今為止性能最好的「真正開源」的模型,不僅有權重和訓練代碼,而且是基于開放數據集DCLM-Baseline。
相比模型性能,DCLM做出的「真正開源」的典范更加引人關注。
對比大部分科技巨頭只搞閉源模型,或「猶抱琵琶半遮面」,只開源代碼或權重的做法,大方的蘋果獲得了網友的好評。
此外,Shankar還預告說,之后會繼續上線模型中間檢查點和優化器狀態。
難道,這就是LLM開源社區的春天了嗎?
DCLM
原文鏈接:OpenAI掀小模型血戰!蘋果DCLM強勢登場,碾壓Mistral 7B全開源
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...