智子引擎發布多模態大模型 Awaker：MOE、自主更新、寫真視頻效果優于 Sora

AIGC動態2年前 (2024)發布 Founder Park

AIGC動態歡迎閱讀

原標題：智子引擎發布多模態大模型 Awaker：MOE、自主更新、寫真視頻效果優于 Sora
關鍵字：模型,智能,任務,視頻,能力
文章來源：Founder Park
內容字數：6726字

內容摘要：

在 4 月 27 日召開的中關村論壇通用人工智能平行論壇上，人大系初創公司智子引擎隆重發布全新的多模態大模型 Awaker 1.0。
相對于智子引擎前代的 ChatImg 序列模型，Awaker 1.0 采用全新的 MOE 架構并具備自主更新能力，是業界首個實現「真正」自主更新的多模態大模型。在視覺生成方面，Awaker 1.0 采用完全自研的視頻生成底座 VDT，在寫真視頻生成上取得好于 Sora 的效果，打破大模型「最后一公里」落地難的困境。
Awaker 1.0 是一個將視覺理解與視覺生成進行超級融合的多模態大模型。在理解側，Awaker 1.0 與數字世界和現實世界進行交互，在執行任務的過程中將場景行為數據反哺給模型，以實現持續更新與訓練；在生成側，Awaker 1.0 可以生成高質量的多模態內容，對現實世界進行模擬，為理解側模型提供更多的訓練數據。尤其重要的是，因為具備「真正」的自主更新能力，Awaker 1.0 適用于更廣泛的行業場景，能夠解決更復雜的實際任務，比如 AI Agent、具身智能、綜合治理、安防巡檢等。
文章基于智子引擎官方稿件，Founder Park 略有

原文鏈接：智子引擎發布多模態大模型 Awaker：MOE、自主更新、寫真視頻效果優于 Sora