<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        OpenELM

        AI工具10個月前發布 AI工具集
        475 0 0

        OpenELM是Apple最新發布的一系列高效開源語言模型,涵蓋了不同參數規模的版本,包括OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B。該系列模型采用創新的層間縮放策略,實現了參數的非均勻分配,從而提升了模型的準確性與效率。OpenELM在多個自然語言處理任務中表現出色,并且其代碼和預訓練模型權重均已開放,旨在推動開放研究和社區的發展。

        OpenELM是什么

        OpenELM是Apple公司最新推出的高效開源語言模型系列,包含OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B等多個版本,提供預訓練和指令微調兩種選擇。該模型運用層間縮放策略,在Transformer架構的每一層中實現參數的非均勻分配,以增強模型的準確度和效率。OpenELM在公共數據集上進行了預訓練,并在多個自然語言處理任務中展現出卓越的性能。其代碼、預訓練模型權重及訓練和評估流程均已開放,旨在促進開放研究與社區的進一步發展。

        OpenELM

        OpenELM的基本信息

        • 參數規模:OpenELM系列共包含八個模型,其中四個為預訓練版本,四個為指令微調版本,參數規模從2.7億到30億不等(270M、450M、1.1B和3B)。
        • 技術架構:OpenELM基于Transformer架構,采用層間縮放策略,通過調整注意力頭數和前饋網絡的乘數,實現參數的非均勻分配。該模型使用分組查詢注意力(Grouped Query Attention,GQA)替代傳統的多頭注意力(Multi-Head Attention,MHA),并選用SwiGLU激活函數代替傳統的ReLU,同時采用RMSNorm作為歸一化層。
        • 預訓練數據:OpenELM使用多個公共數據集進行預訓練,包括RefinedWeb、去重的PILE、RedPajama的子集以及Dolma v1.6的子集,總計約1.8萬億個token。
        • 開源許可:OpenELM的代碼、預訓練模型權重和訓練指南均在開放源代碼許可證下發布,Apple還提供了將模型轉換為MLX庫的代碼,以支持在Apple設備上的推理和微調。

        OpenELM的官網入口

        OpenELM

        OpenELM的技術架構

        • Transformer架構:OpenELM采用僅解碼器的Transformer模型架構,廣泛應用于自然語言處理,特別適合序列數據的處理。
        • 層間縮放(Layer-wise Scaling):通過層間縮放技術,OpenELM有效分配每一層的參數,早期層使用較小的注意力和前饋網絡維度,而后期層則逐漸增大這些維度。
        • 分組查詢注意力(Grouped Query Attention,GQA):GQA是一種改進的注意力機制,取代了傳統的多頭注意力,旨在提升模型處理長距離依賴的能力。
        • RMSNorm歸一化:OpenELM采用RMSNorm作為歸一化層,幫助穩定訓練過程。
        • SwiGLU激活函數:在前饋網絡中,OpenELM使用SwiGLU激活函數,一種門控激活函數,有助于捕捉復雜模式。
        • RoPE位置編碼:OpenELM使用旋轉位置編碼(Rotary Positional Embedding,RoPE),有效處理序列中元素的順序信息。
        • Flash注意力:在計算縮放點積注意力時,OpenELM采用Flash注意力,提供快速且內存高效的注意力計算。

        OpenELM的性能表現

        研究人員將OpenELM與PyThia、Cerebras-GPT、TinyLlama、OpenLM、MobiLlama和OLMo等模型進行了比較。在相似的模型規模下,OpenELM在ARC、BoolQ、HellaSwag、PIQA、SciQ和WinoGrande等主流任務測試中展現出更高的準確性。特別是,相較于OLMo模型,OpenELM在參數數量和預訓練數據更少的情況下,依然保持較高的準確率。

        OpenELM

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 成人性生交视频免费观看| 精品久久久久国产免费| 久久大香伊焦在人线免费| 最近免费中文字幕4| 亚洲一区二区三区国产精品无码| 亚洲色偷偷综合亚洲av78| 久久国产乱子伦精品免费强| 免费看的黄色大片| 亚洲黄色三级视频| 一级特级女人18毛片免费视频| 亚洲性线免费观看视频成熟| 亚洲人成网7777777国产| 亚洲中文字幕乱码AV波多JI| 好吊妞788免费视频播放| 亚洲高清视频免费| 成年网站免费视频A在线双飞| 亚洲高清在线播放| 免费a级毛片无码a∨免费软件| 午夜亚洲国产成人不卡在线| 亚洲人成激情在线播放| 久久精品视频免费看| 亚洲视频在线观看免费视频| 在线观看无码的免费网站| 看一级毛片免费观看视频| 色吊丝最新永久免费观看网站| 特级毛片A级毛片100免费播放| 午夜一级毛片免费视频| 日韩大片在线永久免费观看网站| 国产精品酒店视频免费看| 亚洲中文无码mv| 久久乐国产精品亚洲综合| 黄页视频在线观看免费| 亚洲国产精品特色大片观看完整版| 久久久精品视频免费观看| 亚洲日本在线观看视频| 一级中文字幕免费乱码专区| 男人的天堂亚洲一区二区三区 | 亚洲白嫩在线观看| 久久免费国产视频| 亚洲av永久中文无码精品| 永久免费观看的毛片的网站|