<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Grok-1

        AI工具7個月前發布 AI工具集
        929 0 0

        Grok-1 是由馬斯克創辦的人工智能初創公司 xAI 推出的最新大型語言模型,作為一個混合專家(MoE)模型,它擁有驚人的 3140 億參數,這使其成為當前參數數量最多的開源大語言模型。Grok-1 的開發過程遵循開源原則,所有權重和網絡結構均已公開,基于 Apache 2.0 許可,用戶可以使用、修改和分發,無論是個人還是商業用途均可。

        Grok-1是什么

        Grok-1 是由馬斯克旗下的人工智能初創公司 xAI 開發的一款大型語言模型,它作為一個混合專家(MoE)模型,擁有 3140 億參數,成為現今參數量最大的開源大語言模型。基于開源的理念,Grok-1 的訓練和開發過程均公開,允許用戶在 Apache 2.0 許可下使用、修改和分發。

        Grok-1

        Grok-1的官網入口

        • 官方文章介紹https://x.ai/blog/grok-os
        • GitHub地址https://github.com/xai-org/grok-1
        • Hugging Face地址https://huggingface.co/xai-org/grok-1
        • 模型權重下載magnet:"https://x.ai/model-card/" target="_blank" rel="noopener nofollow" rel="nofollow noopener">https://x.ai/model-card/),Grok-1的信息如下:

          項目詳細信息
          模型細節Grok-1是一個基于Transformer的自回歸模型,預訓練用于下一個token預測。該模型通過來自人類和早期Grok-0模型的廣泛反饋進行了微調。初始版本的Grok-1具有8192個token的上下文長度,并在2023年11月發布。
          預期用途Grok-1旨在用作Grok機器人背后的引擎,可用于問答、信息檢索、創意寫作和編程輔助等多種自然語言處理任務。
          局限性盡管Grok-1在信息處理方面表現出色,但仍需人類對其輸出進行審查以確保準確性。該語言模型無法搜索互聯網。在Grok中部署時,結合搜索工具和數據庫能夠提升模型的能力和準確性。即便如此,模型有時仍可能產生不準確的內容。
          訓練數據Grok-1發布版本所使用的訓練數據來自截至2023年第三季度的互聯網,及xAI的AI訓練人員提供的數據。
          評估Grok-1在多項推理基準任務和精選的國際數學考試問題上進行了評估。xAI已與早期用戶進行接觸,評估了包括對抗在內的Grok-1版本。xAI正在通過Grok的早期訪問擴大早期采用者的范圍,以便進行封閉的beta測試。

          Grok-1的技術細節

          • 基礎模型和訓練:Grok-1是基于大量文本數據進行訓練的,并未針對任何特定任務進行微調,意味著它是一個通用語言模型,適用于多種自然語言處理任務。它的訓練使用了JAX庫和Rust語言構建的定制訓練堆棧。
          • 參數數量:Grok-1擁有3140億個參數,是目前參數量最大的開源大語言模型。每個token的激活權重為25%,展示了模型的規模與復雜性。
          • 混合專家模型(MoE):Grok-1采用混合專家系統設計,將多個專家網絡結合,提高了模型的效率與性能。在Grok-1中,每個token會從8個專家中選擇2個進行處理。
          • 激活參數:Grok-1的激活參數數量達到860億,遠超Llama-2的70B參數,顯示出其在語言任務處理上的潛力。
          • 嵌入和位置嵌入:Grok-1使用旋轉嵌入而非固定位置嵌入,這種方法增強了模型處理長文本的能力。其Tokenizer詞匯量為131,072,類似于GPT-4,嵌入大小為6,144。
          • Transformer層:該模型包含64個Transformer層,每層由多頭注意力塊和密集塊組成。多頭注意力塊有48個用于查詢的頭,8個用于鍵/值(KV),KV大小為128。密集塊的加寬因子為8,隱藏層大小為32,768。
          • 量化:Grok-1還提供部分權重的8bit量化,減少了模型的存儲和計算需求,使其更適合在資源有限的環境中運行。
          • 運行要求:由于Grok-1是一個超大規模模型(314B參數),需要具備足夠GPU內存的機器才能運行。估計需要一臺擁有628GB GPU內存的機器(每個參數2字節)。
        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲综合精品成人| 亚洲一久久久久久久久| 免费精品国自产拍在线播放| 国产免费播放一区二区| 午夜性色一区二区三区免费不卡视频 | 亚洲精品无码久久久久| 国产精品亚洲精品| 在线人成免费视频69国产| 热99re久久精品精品免费| 亚洲av无码国产精品夜色午夜| 亚洲精品日韩一区二区小说| 一级毛片aaaaaa免费看| 国产精品久久久久影院免费| 久久水蜜桃亚洲av无码精品麻豆| 日日摸夜夜添夜夜免费视频| 成人毛片18女人毛片免费96| 亚洲AV本道一区二区三区四区| 特级毛片A级毛片100免费播放 | 国产精品亚洲一区二区三区在线观看 | 国产亚洲精品岁国产微拍精品| 永久免费av无码网站yy| 亚洲视频免费在线观看| 国产精品福利在线观看免费不卡 | 国产一区二区三区在线免费观看 | 久久er国产精品免费观看8| 精品亚洲永久免费精品| 一个人看的www免费在线视频| 日本人护士免费xxxx视频| 亚洲午夜精品一区二区公牛电影院| 可以免费观看的国产视频| 国产亚洲精品AA片在线观看不加载| 春暖花开亚洲性无区一区二区| 无人在线观看免费高清视频| 亚洲欧洲国产经精品香蕉网| 三年片在线观看免费大全电影| 在线亚洲精品自拍| 久久成人18免费网站| 亚洲国产精品成人精品软件| 国产传媒在线观看视频免费观看| 野花香高清在线观看视频播放免费| 亚洲人成网站日本片|