AIGC動態歡迎閱讀
原標題:FBI-LLM低比特基礎大語言模型來了,首個完全從頭訓練的二值化語言模型
關鍵字:模型,參數,損失,精度,規模
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com作者介紹:論文一作Liqun Ma目前是MBZUAI機器學習系的博士生,導師為Zhiqiang Shen助理教授,同時也是該論文的最后作者,其在加入MBZUAI之前為CMU博士后,研究領域主要為機器學習,基礎大模型等等。Liqun的主要研究方向為高效的大模型預訓練和微調,他本科畢業于天津大學。論文二作Mingjie Sun目前為CMU計算機系在讀博士,導師為Zico Kolter教授。
自回歸訓練方式已經成為了大語言模型(LLMs)訓練的標準模式, 今天介紹一篇來自阿聯酋世界第一所人工智能大學MBZUAI的VILA實驗室和CMU計算機系合作的論文,題為《FBI-LLM: Scaling Up Fully Binarized LLMs from Scratch
原文鏈接:FBI-LLM低比特基礎大語言模型來了,首個完全從頭訓練的二值化語言模型
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...