国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

開源1.6B小模型「小狐貍」,表現(xiàn)超同類模型Qwen和Gemma

AIGC動態(tài)11個月前發(fā)布 智猩猩GenAI
591 0 0

最近,世界模型(World Models)似乎成為了 AI 領域最熱門的研究方向。自從 Chatgpt 誕生以來,LLM(大語言模型)的參數(shù)量似乎就成為了各個公司的競賽指標。GPT-1 參數(shù)量為 1.17 億(117M),而它的 GPT-4 參數(shù)量已經刷新到了 1.8 萬億(1800B)。像其他 LLM 模型例如 Bloom(1760 億,176B)和 Chinchilla(700 億,70B)的參數(shù)量也在不斷飆升。參數(shù)的數(shù)量直接影響了模型的性能和能力,更多的參數(shù)意味著模型能夠處理更復雜的語言模式,理解更豐富的上下文信息,并在多種任務上表現(xiàn)出更高的智能水平。但是,這些巨量參數(shù)也會直接影響 LLM 的訓練成本和開發(fā)環(huán)境,也限制了大多數(shù)普通研究公司對于 LLM 的探索,導致大語言模型逐漸成為了大公司之間的軍備競賽。近日,新興 AI 公司 TensorOpera 發(fā)布了開源小語言模型 FOX,向業(yè)內證明了小語言模型(SLM)也可以在智能體領域展現(xiàn)足夠的實力。FOX 是一個專為云計算和邊緣計算設計的小型語言模型。與動輒上百億參數(shù)的大語言模型不同,F(xiàn)OX 僅有 16 億參數(shù),卻能在多項任務中展現(xiàn)出驚人的性能。論文題目:FOX-1 TECHNICAL REPORT論文鏈接:https://arxiv.org/abs/2411.0528101TensorOpera 是誰TensorOpera 是一家位于加州硅谷的創(chuàng)新人工智能公司。他們之前開發(fā)了 TensorOpera? AI Platform 生成型 AI 生態(tài)系統(tǒng)和 TensorOpera? FedML 聯(lián)邦學習和分析平臺。公司名稱 TensorOpera, 是技術和藝術的結合,象征著 GenAI 最終實現(xiàn)多模態(tài)和多模型復合 AI 系統(tǒng)的發(fā)展趨。TensorOpera 的聯(lián)合創(chuàng)始人兼 CEO Jared Kaplan 博士表示:”FOX 模型的設計初衷是為了在保持高性能的同時,大幅降低計算資源需求。這不僅讓 AI 技術更加親民,也為企業(yè)降低了使用門檻。”02Fox 模型是怎么做的為了通過較小的參數(shù)量達到與 LLM 相同的效果,F(xiàn)ox-1 模型僅采用解碼器架構,并引入了各種改進和重新設計以獲得更好的性能。其包括① 網絡層數(shù):在模型架構設計中,更寬且更淺的神經網絡擁有更好的記憶能力,而更深且更瘦的網絡則呈現(xiàn)出更強的推理能力。根據這一原則,F(xiàn)ox-1 使用的架構比大多數(shù)現(xiàn)代 SLMs 更深。具體來說,F(xiàn)ox-1 由 32 個自注意力層組成,比 Gemma-2B(18 層)深 78%,比 StableLM-2-1.6B(24 層)和 Qwen1.5-1.8B(24 層)深 33%。② 共享嵌入:Fox-1 采用 2,048 的隱藏維度去構建共計 256,000 的詞匯表,其數(shù)據量大約有 5 億參數(shù)。更大的模型通常對輸入層(詞匯表到嵌入表達)和輸出層(嵌入表達到詞匯表)使用單獨的嵌入層。對于 Fox-1,僅嵌入層就需要 10 億參數(shù)。為了減少總參數(shù)數(shù)量,共享輸入和輸出嵌入層,可以最大限度地提高權重利用率。③ 預歸一化:Fox-1 對每個變換層的輸入使用 RMSNorm 進行歸一化。RMSNorm 是現(xiàn)代大型語言模型中預歸一化的首選,它比 LayerNorm 表現(xiàn)出更好的效率。④ 旋轉式位置編碼(RoPE):Fox-1 默認接受最多 8K 長度的 input token。為了提高更長上下文窗口的性能,F(xiàn)ox-1 采用了旋轉式位置編碼,其中 θ 設置為 10,000,以便于編碼 token 之間的相對位置依賴性。⑤ 分組查詢注意力(GQA):分組查詢注意力將多頭注意力層的查詢頭分為組,每個組共享相同的一組鍵值頭。Fox-1 配備 4 個鍵值頭和 16 個注意力頭,以提高訓練和推理速度,并減少內存使用。除了模型結構改良之外,F(xiàn)OX-1 也在分詞(Tokenization)和訓練上進行改進。分詞方面,F(xiàn)ox-1 采用基于 SentencePiece 的 Gemma 分詞器,它提供了 256K 的詞匯表大小。增加詞匯表大小至少有兩個主要好處。首先,由于每個 token 編碼了更密集的信息,上下文的隱藏信息長度得以延長。例如,大小為 26 的詞匯表只能在[a-z]中編碼一個字符,但大小為 262 的詞匯表可以同時編碼兩個字母,這使得在固定長度的 token 中可以表示更長的字符串。其次,更大的詞匯表大小減少了未知單詞或短語的概率,從而在實踐中實現(xiàn)了更好的下游任務性能。Fox-1 采用的大詞匯表對于給定的文本語料庫產生較少的 token,這可以產生更好的推理性能。Fox-1 的預訓練數(shù)據來源于 Redpajama、SlimPajama、Dolma、Pile 和 Falcon 數(shù)據集,共計 3 萬億個文本數(shù)據。為了緩解因其注意力機制導致的長序列的預訓練效率低下,F(xiàn)ox-1 在預訓練階段引入了一個三階段的課程學習策略,其中訓練樣本的 chunk 長度逐漸從 2K 增加到 8K,以小成本確保長上下文能力。為了與三階段課程預訓練管道保持一致,F(xiàn)ox-1 將原始數(shù)據重新組織成三個不同的集合,包括無監(jiān)督和指令調優(yōu)數(shù)據集,以及代碼、網絡內容、數(shù)學和科學文檔等不同領域的數(shù)據。Fox-1 的訓練可以分為三個階段。第一階段包括整個預訓練過程中約 39% 的總數(shù)據樣本,其中 1.05 萬億 token 的數(shù)據集被分割成長度為 2,000 的樣本,batch size 大小為 2M。在此階段使用了 2,000epoch 的線性預熱。第二階段包括約 59% 的樣本,有 1.58 萬億 token,并將 chunk 長度從 2K 增加到 4K 和 8K。實際的 chunk 長度因不同數(shù)據源而異。考慮到第二階段花費的時間最長,且涉及不同數(shù)據集的不同來源,batch size 也增加到 4M 以提高訓練效率。最后在第三階段,F(xiàn)ox 模型使用 62 億 token(約總量的 0.02%)的高質量數(shù)據進行訓練,為不同的下游任務能力打下基礎,如指令遵循、閑聊、特定領域的問答等。03Fox-1 表現(xiàn)如何和其他 SLM 模型(Gemma-2B, Qwen1.5-1.8B, StableLM-2-1.6B 和 OpenELM1.1B)相比,F(xiàn)OX-1 在 ARC Challenge (25-shot), HellaSwag (10-shot), TruthfulQA(0-shot),MMLU (5-shot),Winogrande (5-shot),GSM8k (5-shot)六項任務的 benchmark 的平均分數(shù)最高,且在 GSM8k 上優(yōu)勢明顯。除此之外,TensorOpera 還評估了 Fox-1、Qwen1.5-1.8B 和 Gemma-2B 使用 vLLM 與 TensorOpera 服務平臺在單個 NVIDIA H100 上的端到端的推理效率。Fox-1 實現(xiàn)了每秒超過 200 個 token 的吞吐量,超過了 Gemma-2B,并在相同的部署環(huán)境中與 Qwen1.5-1.8B 相匹配。在 BF16 精度下,F(xiàn)ox-1 僅需要 3703MiB 的 GPU 內存,而 Qwen1.5-1.8B、StableLM-2-1.6B 和 Gemma-2B 分別需要 4739MiB、3852MiB 和 5379MiB。04參數(shù)雖小,依舊有競爭力目前各家 AI 公司都在大語言模型上開展競爭,而 TensorOpera 另辟蹊徑,在 SLM 領域進行突破,僅用 1.6B 實現(xiàn)了與 LLM 相似的效果,在各種基準測試中表現(xiàn)出色。即使在有限的數(shù)據資源下,TensorOpera 也可以預訓練出具有競爭力表現(xiàn)的語言模型,為其他 AI 公司的研發(fā)提供了一種新思路。END點擊下方名片即刻關注我們

閱讀原文
? 版權聲明
蟬鏡AI數(shù)字人

相關文章

蟬鏡AI數(shù)字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        成人激情免费电影网址| 色综合天天综合网天天狠天天| 4438x成人网最大色成网站| 日韩视频一区二区在线观看| 美洲天堂一区二卡三卡四卡视频 | 色综合久久88色综合天天 | 亚洲一区二区三区免费视频| 色屁屁一区二区| 日韩成人一级大片| 国产色综合久久| 91在线免费视频观看| 亚洲成av人片在线| 99精品视频在线观看免费| 一区二区三区中文在线观看| 国产黑丝在线一区二区三区| 国产精品国产三级国产普通话蜜臀| 奇米777欧美一区二区| 久久先锋影音av| 99国产精品国产精品毛片| 日韩精品免费专区| 日本一区二区三区在线观看| 91久久精品国产91性色tv| 久久99久久99小草精品免视看| 欧美在线观看18| 国产在线精品一区二区不卡了| 69堂精品视频| 99久久精品国产毛片| 欧美国产精品久久| 欧美一区二区日韩一区二区| 成人中文字幕电影| 欧美aaaaa成人免费观看视频| 在线不卡一区二区| 日韩va欧美va亚洲va久久| 欧美日本在线看| 99麻豆久久久国产精品免费| 青草av.久久免费一区| 欧美一区二区三区啪啪| 日韩和欧美的一区| 亚洲人快播电影网| 国产女同互慰高潮91漫画| 777色狠狠一区二区三区| 日韩在线观看一区二区| 欧美一二区视频| 欧美日韩视频专区在线播放| 成人福利在线看| 一区二区视频在线| 国产视频不卡一区| 久久影音资源网| 日韩午夜激情免费电影| 欧美日韩中字一区| 欧美日本视频在线| 欧美日韩久久一区| 欧美天天综合网| 久久国产精品第一页| 秋霞午夜鲁丝一区二区老狼| 久久精品视频网| 精品国产电影一区二区| 91视频一区二区三区| 波多野结衣的一区二区三区| 成人免费视频国产在线观看| 五月婷婷综合网| 亚洲v精品v日韩v欧美v专区| 一区二区三区不卡视频| 一区二区三区在线观看网站| 欧美一卡2卡三卡4卡5免费| 国产精品伊人色| 亚洲一二三四区不卡| 亚洲自拍偷拍麻豆| 精品日韩一区二区三区| 欧美精品一区二区三区在线| 欧美刺激午夜性久久久久久久| av电影在线观看完整版一区二区| 日本中文字幕一区二区有限公司| 久久精品人人爽人人爽| 欧美午夜视频网站| 日韩三级电影网址| 中文字幕精品三区| 中文字幕一区二区不卡| 国产亚洲一二三区| 国产精品美女视频| 337p粉嫩大胆噜噜噜噜噜91av| 欧美日韩综合不卡| 日韩三级高清在线| 国产色91在线| 亚洲永久免费av| 亚洲色图欧美偷拍| 秋霞av亚洲一区二区三| 国产成人av电影在线| 欧美在线视频日韩| 色综合久久综合| 99国产一区二区三精品乱码| 欧洲一区在线电影| 一本一本大道香蕉久在线精品| 国产一区中文字幕| 在线一区二区观看| 久久亚洲精品国产精品紫薇| 亚洲精品成人精品456| 久久精品99国产精品日本| 成人动漫中文字幕| 欧美一区二区在线视频| 亚洲国产高清aⅴ视频| 亚洲va国产天堂va久久en| 亚洲成av人**亚洲成av**| 国产传媒久久文化传媒| 91精品国产综合久久久久久久 | 91福利在线播放| 精品欧美乱码久久久久久| 亚洲三级在线看| 国产一区美女在线| 国产麻豆精品在线观看| 91成人国产精品| 国产精品理论在线观看| 精品在线视频一区| 7777精品久久久大香线蕉| 亚洲免费观看高清完整版在线| 亚洲精品视频在线观看免费| 国产九色精品成人porny | 91精品国产日韩91久久久久久| 欧美日韩日日摸| 亚洲天堂免费在线观看视频| 精品综合免费视频观看| 91精品国产综合久久福利软件| 久久色在线观看| 天天av天天翘天天综合网色鬼国产| 日韩中文欧美在线| 欧美视频自拍偷拍| 一区二区日韩av| 91福利视频网站| 亚洲精品国产一区二区精华液 | 一个色综合av| 99久久er热在这里只有精品66| 欧美亚洲国产一区二区三区va | 国产成人8x视频一区二区 | 97久久久精品综合88久久| 国产无遮挡一区二区三区毛片日本| 亚洲欧美国产毛片在线| 天天色天天操综合| 欧美老肥妇做.爰bbww视频| 香蕉乱码成人久久天堂爱免费| 韩国视频一区二区| 欧美成人精品福利| 国产盗摄女厕一区二区三区| 精品视频全国免费看| 午夜精品久久久久影视| 欧美肥妇毛茸茸| 紧缚奴在线一区二区三区| 欧美性生活影院| 日韩精品久久理论片| 精品久久国产老人久久综合| 国产一区二区看久久| 国产精品人妖ts系列视频| 久久不见久久见中文字幕免费| 色综合久久88色综合天天免费| 欧美不卡123| 国产91丝袜在线播放| 《视频一区视频二区| 欧美日韩国产欧美日美国产精品| 亚洲欧洲成人av每日更新| 欧美三级日韩在线| 成人免费在线视频| 欧美日韩一区二区三区高清 | 日一区二区三区| 精品动漫一区二区三区在线观看| 五月婷婷综合激情| 精品福利二区三区| 一本久道久久综合中文字幕| 亚洲成在人线免费| 久久精品一级爱片| 欧美日韩一卡二卡三卡| 亚洲一区二区三区三| 欧美成人精品高清在线播放| 99视频在线观看一区三区| 日本免费新一区视频| 国产精品美女久久久久久久久久久| 国产乱码精品一区二区三| 一区二区三区日韩在线观看| 精品成人一区二区| 欧美体内she精高潮| 国产成都精品91一区二区三| 日韩中文字幕av电影| 亚洲精选免费视频| 国产精品久久久久久户外露出| 成人av网站免费| 奇米精品一区二区三区四区| 一区二区三区中文免费| 国产精品全国免费观看高清 | 国产精品久久久久婷婷| 欧美一区二区三区小说| 日本久久电影网| 成人午夜视频福利| 久久精品国产澳门| 午夜亚洲国产au精品一区二区| 69av一区二区三区| 99久久精品99国产精品 | 国产日韩欧美精品在线| 欧美精品久久一区二区三区| 色诱视频网站一区| 99天天综合性| 91视频.com| 国产成人亚洲精品青草天美 |