YAYI-Ultra – 中科聞歌推出的混合專家模型
YAYI-Ultra 是中科聞歌推出的企業級大語言模型的旗艦產品,具備卓越的多領域專業能力及多模態內容生成能力。該模型可覆蓋數學、編程、金融、輿情、中醫和安全等多個領域,旨在緩解垂直領域遷移時常見的“蹺蹺板”現象。
YAYI-Ultra是什么
YAYI-Ultra(雅意)是中科聞歌研發的頂尖企業級大語言模型,擁有強大的跨領域專業能力和多模態內容生成技術。它支持長達128k的輸入和更廣泛的上下文窗口,具備超過1000萬對圖文數據的多模態能力。YAYI-Ultra 還支持多輪對話的角色扮演、內容安全風控以及10多個智能插件的調用。
YAYI-Ultra的主要功能
- 多領域專業能力:YAYI-Ultra 采用混合專家模型,能夠組合數學、編程、金融、輿情、中醫和安全等各領域的專家,從而有效解決稠密模型在垂直領域遷移時的“蹺蹺板”問題。
- 多模態內容生成:支持圖文結合的輸出,能夠根據用戶的提問從知識庫提取相關信息,并同時提供對應的視覺內容。
- 超長文輸出:支持最長20萬字的輸入和10萬字的超長輸出,形成從“輸入理解”到“內容創作”的完整長文本能力閉環。
- 數據分析與可視化:準確完成數據分析、計算及圖表繪制任務。
- 復雜任務智能規劃:增強多工具串行調用場景下的合理性,能夠將復雜任務拆解為多個子任務,通過調動搜索引擎、代碼解釋器、圖像解析等基礎工具,以及新聞熱榜追蹤、傳播影響力分析等垂直領域工具來完成任務。
- 聯網智能創作:支持通過網絡收集信息進行創作,例如撰寫一篇關于中國儒家文化發展歷史的分析報告。
YAYI-Ultra的技術原理
- 混合專家架構:YAYI-Ultra 采用混合專家模型架構,支持多種領域專家的組合,為不同領域提供高精度、低能耗的智能化解決方案,有效緩解稠密模型在垂直領域遷移過程中存在的問題。
- 指令微調與數據驅動:基于大規模高質量多語言數據的訓練,結合指令微調技術,使YAYI-Ultra在不同領域和任務上表現卓越。
YAYI-Ultra的評測表現
在OpenCompass大模型公開學術榜單中,YAYI-Ultra以64.5分首次躋身前十,成為TOP10中五個中國大模型之一。具體表現如下:
- 代碼生成:在LiveCodeBench中排名第五,表現優于GPT-4o-20241120版本。
- 復雜指令理解:在IFEval中排名第九。
- 知識推理能力:在MMLU-Pro中排名第九。
YAYI-Ultra的項目地址
- Github倉庫:https://github.com/wenge-research/YAYI2
- HuggingFace模型庫:https://huggingface.co/wenge-research
YAYI-Ultra的應用場景
- 媒體領域:幫助客戶將內容創作時間縮短30%-50%,提升內容發布頻率20%-40%,將內容差錯率從5%降低至0.5%左右。
- 醫療領域:基于YAYI的大醫金匱中醫模型,能夠精準診斷500余種常見病癥,辨證推理準確率高達90%。并已推出面向終端用戶的“大醫金匱”中醫健康管理APP。
- 財稅領域:基于YAYI的財稅知識模型,模型回答準確率達到90.1%,高于同類模型,助力客戶實現24小時不間斷的咨詢服務。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...