小米大模型首次曝光
8月14日,小米新品發布會在北京國家會議中心舉行,小米集團創始人、董事長兼CEO雷軍在年度公開演講中表示,今年4月小米組建了AI大模型團隊,全面擁抱大模型,第一個應用大模型就是將智能語音助理小愛同學升級了大模型版本,并開啟邀請測試。據其介紹,小米大模型技術的主力突破方向為輕量化、本地部署,優先在手機上實現端側跑通。小米將全力優化百億參數大模型,目前已在手機端跑通13億參數的大模型,證明手機端大模型部分場景效果可媲美云端。
小愛同學大模型內測申請通道
小愛同學大模型版邀測招募
https://web.vip.miui.com/page/info/mio/mio/detail?postId=41070692
報名方式
方式1:小米社區APP,可直接點擊此處報名
方式2:打開小米社區APP,在首頁找到【更多頻道】,點擊【內測中心】,申請參加【小愛同學大模型內測】
方式3:試試對小愛說“內測報名”, 可直達報名頁面
小米大模型概況
此前小米公司并未“官宣”直接加入 AI 大模型賽道中,不過小米的 AI 大模型 MiLM-6B 目前已經悄然現身 C-Eval、CMMLU 大模型評測榜單,截至當前,小米大模型在 C-Eval 總榜單排名第 10、同參數量級排名第 1。
根據 GitHub 項目頁給出的信息得知,MiLM-6B 是由小米公司開發的一個大規模預訓練語言模型,參數規模達 64 億。
小米大模型 MiLM-6B 項目地址:
https://github.com/XiaoMi/MiLM-6B

而根據 C-Eval 給出的信息,MiLM-6B 模型在具體各科目成績上,在 STEM(科學、技術、工程和數學教育)全部 20 個科目中,計量師、物理、化學、生物等多個項目獲得了較高的準確率。

據悉,MiLM-6B 模型目前已經在大多數文科科目中表現出了相對良好的準確度,不過在“法學、數學、編程、概率論、離散數學”等涉及“抽象思維”的科目中,還有一定進步空間。
小米大模型的特點
在 10 個“社會科學”測試科目中,除“教育學和地理”外,該模型在其他 8 個科目中都獲得了較為理想的準確率。在人文科學的 11 個科目中,MiLM-6B 則在“歷史與法律”基礎上有著不錯的準確率表現。
- 小米大模型MiLM-6B是小米AI實驗室推出的一款自然語言處理模型,該模型在C-Eval和CMMLU大模型評測榜單中首次亮相,并取得了不俗的成績。以下是該模型的亮眼性能:
- 參數量級較大:MiLM-6B擁有超過20億個參數,是目前中文預訓練語言模型中參數量最大的之一。這使得它可以更好地捕捉中文語言的復雜性和多樣性,提高其在各種自然語言處理任務中的性能表現。
- 優秀的語義理解能力:MiLM-6B在多個中文自然語言處理任務中都表現出色,如情感分析、文本分類、命名實體識別等。它能夠準確地理解文本的語義信息,并根據任務要求進行相應的處理。
- 強大的生成能力:除了理解文本外,MiLM-6B還具有生成文本的能力。它可以生成符合語法規范、通順流暢的中文文本,并且在一些任務中甚至能夠達到與人類相似的表現水平。
- 可擴展性強:MiLM-6B采用了分層架構的設計,可以根據具體任務的需求進行靈活的調整和擴展。例如,可以通過增加層數或調整神經元數量來提高模型的性能表現,或者通過增加任務類型來擴大應用范圍。
- 開源開放:MiLM-6B是一個開源的項目,任何人都可以在其官方網站上下載到相關的代碼和數據集,并根據自己的需求進行二次開發和應用。這種開放的態度有助于推動中文自然語言處理領域的發展和創新。
數據評估
本站OpenI提供的MiLM 小米大模型都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2023年 8月 15日 上午9:42收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除,OpenI不承擔任何責任。