AIGC動態歡迎閱讀
原標題:蘋果智能背后模型公布:3B模型優于Gemma-7B,服務器模型媲美GPT-3.5-Turbo
關鍵字:模型,蘋果,適配器,基礎,數據
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
編輯:小舟、陳萍在剛剛結束的全球開發者大會上,蘋果宣布了 Apple intelligence, 這是一款深度集成于 iOS 18、iPadOS 18 和 macOS Sequoia 的全新個性化智能系統。Apple Intelligence 由多種高度智能的生成模型組成,這些模型專為用戶的日常任務設計。在蘋果剛剛更新的博客中,他們詳細介紹了其中兩款模型:
一個擁有約 30 億參數的設備端語言模型;
一個更大的基于服務器的語言模型,該模型通過私有云計算在蘋果服務器上運行。這兩個基礎模型是蘋果生成模型家族的一部分,蘋果表示,他們會在不久的將來分享更多關于這一模型家族的信息。
在這篇博客中,蘋果用大量篇幅介紹了他們是如何開發高性能、快速且節能的模型;如何進行這些模型的訓練;如何為特定用戶需求微調適配器;以及如何評估模型在提供幫助和避免意外傷害方面的表現。蘋果基礎模型的建模概覽
預訓練
基礎模型是在 AXLearn 框架上訓練而成的,這是蘋果在 2023 年發布的一個開源項目。該框架建立在 JAX 和 XLA 之上,使得用戶能夠在各種硬件和云平臺上高效且可擴展地訓練模型,包括
原文鏈接:蘋果智能背后模型公布:3B模型優于Gemma-7B,服務器模型媲美GPT-3.5-Turbo
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...