剛開年,大模型廠商就開始「卷」起來了。
原標題:昆侖萬維「天工4.0」攜超強o1/4o霸氣上線!強推理+實時語音,免費無限體驗
文章來源:機器之心
內容字數:10137字
大模型發展范式轉移:推理能力成未來
1. **預訓練時代走向終結?**: 文章指出,Ilya Sutskever在NeurIPS大會上預測,大模型的Scaling Law正在放緩,預訓練時代即將結束,未來研究將更注重推理能力的提升。國內外許多從業者也觀察到類似趨勢,訓練的Scaling Law放緩,但基于慢思考的推理Scaling Law開始涌現。
2. **多模態融合成大勢所趨**: 隨著大模型應用范圍擴大,單一模態的局限性日益明顯,多模態融合成為提升用戶體驗的關鍵。然而,國內能同時注重推理能力提升和多模態融合的公司并不多。
3. **昆侖萬維:推理和多模態雙線并進**: 昆侖萬維是少數同時推進兩條路線的公司之一。其發布的天工大模型4.0 o1 (Skywork o1)專注于推理能力,而天工大模型4.0 4o (Skywork 4o)則側重語音對話能力,并已全量免費上線。
Skywork o1: 強大的推理能力
4. **Skywork o1 的優異表現**: Skywork o1 在數學、代碼等領域的基準測試中取得了令人矚目的成績,例如在AMC-23、AIME-24等數學競賽中達到或接近SOTA水平,在HumanEval和MBPP代碼測試中也表現出色。其在自定義的推理能力評估集上也顯著優于常規通用大模型。
5. **全方位推理能力測試**: 文章通過“海龜湯”、“過河”問題、“真話者與說謊者”、公務員行測類比推理題以及考研數學題等案例,展示了Skywork o1強大的多類型推理能力,包括發散性思維、邏輯推理、問題拆解、逆向思維、信息整合與分析等。
Skywork o1 的訓練方法
6. **三階段訓練方案**: Skywork o1 的強大推理能力源于其獨特的三階段訓練方案:第一階段,通過自研多智能體體系構造高質量推理數據進行預訓練和微調;第二階段,使用自研的Skywork o1 Process Reward Model (PRM)進行強化學習,提升推理能力;第三階段,基于自研的Q*算法進行推理規劃,優化搜索路徑。
Skyo: 逼真的語音對話AI助手
7. **Skyo 的優勢**: Skyo 利用端到端建模,實現了低延遲、可打斷、音真、情感豐富的語音對話體驗,其在情緒感知和情感共鳴方面也表現出色。
8. **端到端建模的優勢**: Skyo 的端到端建模方案避免了傳統ASR+NLU+TTS級聯方案的缺陷,使其能夠像真人一樣進行自然流暢的語音對話。
2025年大模型競爭新階段
9. **未來發展趨勢**: 文章預測2025年大模型競爭將進入新的階段,關鍵詞包括推理能力、AI智能體、空間智能和AI應用。 要做好AI智能體,需要強大的推理能力;要做好空間智能和AI應用,需要強大的多模態能力。
10. **昆侖萬維的優勢和未來展望**: 昆侖萬維在推理和多模態大模型方面均有布局,并已取得了一些應用成果,這使其在通往AGI的道路上更具信心。 文章最后展望了昆侖萬維在AI領域的未來發展。
聯系作者
文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺