蘋果大模型MM1殺入場(chǎng):300億參數(shù)、多模態(tài)、MoE架構(gòu),超半數(shù)作者是華人

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:蘋果大模型MM1殺入場(chǎng):300億參數(shù)、多模態(tài)、MoE架構(gòu),超半數(shù)作者是華人
關(guān)鍵字:數(shù)據(jù),圖像,模型,研究者,樣本
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):8519字
內(nèi)容摘要:
機(jī)器之心報(bào)道
機(jī)器之心編輯部蘋果也在搞自己的大型多模態(tài)基礎(chǔ)模型,未來(lái)會(huì)不會(huì)基于該模型推出相應(yīng)的文生圖產(chǎn)品呢?我們拭目以待。
今年以來(lái),蘋果顯然已經(jīng)加大了對(duì)生成式人工智能(GenAI)的重視和投入。此前在 2024 蘋果股東大會(huì)上,蘋果 CEO 蒂姆?庫(kù)克表示,今年將在 GenAI 領(lǐng)域?qū)崿F(xiàn)重大進(jìn)展。此外,蘋果宣布放棄 10 年之久的造車項(xiàng)目之后,一部分造車團(tuán)隊(duì)成員也開始轉(zhuǎn)向 GenAI。
如此種種,蘋果向外界傳達(dá)了加注 GenAI 的決心。目前多模態(tài)領(lǐng)域的 GenAI 技術(shù)和產(chǎn)品非常火爆,尤以 OpenAI 的 Sora 為代表,蘋果當(dāng)然也想要在該領(lǐng)域有所建樹。
今日,在一篇由多位作者署名的論文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中,蘋果正式公布自家的多模態(tài)大模型研究成果 —— 這是一個(gè)具有高達(dá) 30B 參數(shù)的多模態(tài) LLM 系列。論文地址:https://arxiv.org/pdf/2403.09611.pdf
該團(tuán)隊(duì)在論文中探討了不同架構(gòu)組件和數(shù)據(jù)選擇的重要性。并且,通過對(duì)圖像編碼器
原文鏈接:蘋果大模型MM1殺入場(chǎng):300億參數(shù)、多模態(tài)、MoE架構(gòu),超半數(shù)作者是華人
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)

粵公網(wǎng)安備 44011502001135號(hào)