原標題:DeepSeek掀低成本,中科院系黑馬闖入全球TOP 10!高精度-低能耗困局
文章來源:新智元
內容字數:6760字
2025中國大模型發展新篇章:DeepSeek與YAYI-Ultra的崛起
2025年,中國大模型領域涌現出令人矚目的突破。DeepSeek憑借深度推理和低成本優勢強勢崛起,而中科院系AI企業中科聞歌發布的YAYI-Ultra大模型則在代碼能力上超越GPT-4o,躋身OpenCompass榜單全球前十,展現了中國大模型技術的飛速發展。
1. DeepSeek:低成本高性能的典范
DeepSeek的出現,打破了國內大模型領域對算力依賴的固有認知,證明了通過算法優化,同樣可以以低算力訓練出高質量的模型。其深度推理模型DeepSeek-R1在問答表現上尤為出色,成功進入國際大模型頭部梯隊,為國內企業提供了彎道超車的希望。
2. YAYI-Ultra:OpenCompass榜單前十,多領域能力突出
中科聞歌的YAYI-Ultra大模型在OpenCompass榜單中取得了優異成績,綜合得分64.5,排名第十,成為TOP10中五個中國大模型之一。其代碼生成能力超越GPT-4o,并在復雜指令理解和知識推理方面也表現突出。尤其在中文理解的C-Eval評測中排名第二,展現了其在中文場景下的技術優勢。
3. YAYI-Ultra的多項能力實測
實測顯示,YAYI-Ultra在多個方面表現出色:
- 視覺理解升級:準確理解和處理圖表信息,支持跨語言多模態理解,能夠應對復雜圖表場景。
- 表格理解:精準解析復雜表格,提取關鍵數據,并進行跨語言問答。
- 復雜任務智能規劃(Function Call):能夠通過調用搜索引擎、代碼解釋器等工具,完成復雜任務的規劃和執行,例如繪制奧運會獎牌數量折線圖。
- 多模態輸出:支持圖文并茂的輸出,提升信息獲取和理解效率。
- 全棧長文生成:支持超長文本輸入和輸出,并提供聯網智能創作和文獻錨定創作兩種模式,保證文本結構和質量。
- 數據分析與可視化:能夠完成數據分析、計算和圖表繪制任務,支持Python代碼生成和執行。
4. YAYI-Ultra的靈活專家配置,突破大模型落地瓶頸
YAYI-Ultra采用靈活的專家配置模式,支持多種領域專家組合,有效解決了大模型在垂直領域遷移過程中存在的“蹺蹺板”現象,為不同行業提供高精度、低能耗的智能化解決方案。目前,YAYI-Ultra已在媒體、醫療、財稅等領域得到應用,取得了顯著成效。
5. YAYI-Ultra的應用案例
YAYI-Ultra已成功應用于多個領域,例如:中科聞歌紅旗3.0融媒體智能平臺提升了媒體內容創作和發布效率;大醫金匱中醫大模型提高了中醫診斷準確率;財稅知識大模型提升了財稅咨詢服務效率。
6. 結語
DeepSeek和YAYI-Ultra的成功,標志著中國大模型技術取得了重大突破,也為未來大模型發展指明了方向。未來,高精度、低能耗的大模型將解決更多實際問題,為各行各業帶來更大的價值。
聯系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。