國內首個全場景深度思考模型問世。
原標題:最懂醫療的國產推理大模型,果然來自百川智能
文章來源:機器之心
內容字數:8400字
百川智能發布國內首個全場景深度思考模型Baichuan-M1-preview,引領AI大模型新一輪競爭
近日,全球AI大模型競爭進入白熱化階段,百川智能發布國內首個全場景深度思考模型Baichuan-M1-preview,標志著這一輪軍備競賽達到。該模型具備語言推理、視覺推理和搜索推理三大能力,在多個權威評測中超越了GPT-4o、Claude3.5 Sonnet等模型,并在百小應App上線。
Baichuan-M1-preview 的核心能力與優勢
全場景推理能力:Baichuan-M1-preview 同時具備語言、視覺和搜索三種推理能力,能夠處理更復雜的問題。
卓越的數學和代碼能力:在數學基準測試和代碼任務上超越了o1-preview等模型,展現出強大的邏輯推理和代碼理解能力。
領先的視覺推理能力:在MMMU-val、MathVista等權威評測中,其視覺推理能力超越了GPT-4o、Claude3.5 Sonnet等模型。
醫療循證模式:Baichuan-M1-preview 的一大亮點是其醫療循證模式,能夠像資深醫療專家一樣進行深度思考,并基于億級條目的循證醫學知識庫提供可靠的醫學解答,顯著提升了醫療推理的可靠性。
醫療循證模式詳解
Baichuan-M1-preview 的醫療循證模式,通過自建的涵蓋億級條目的循證醫學知識庫,并對證據進行多層分級和專業分析,避免信息混雜導致的誤判,最終形成全面、連貫的醫學結論。此模式提升了模型醫療結果的可信度,也為大模型在醫療等高度專業領域的落地應用指明了方向,可輔助臨床診斷和治療,提升醫學科研效率,并為患者提供可靠的第二診療意見。
Baichuan-M1-14B 開源及技術細節
百川智能開源了Baichuan-M1-14B模型,該模型在權威醫學知識和臨床能力評測上表現優異,超越了更大參數量的Qwen2.5-72B-Instruct。其技術細節包括:
萬億級token嚴肅醫療數據:涵蓋中/英文專業醫療論文、真實醫療病例、教材書籍等,并進行數據合成,生成超千億token高質量醫療推理數據。
多階段領域提升方案:將訓練分為通識提升、醫療基礎知識提升和醫療進階知識提升三個階段,逐步提升模型能力。
系統化強化學習訓練流程:采用ELO、TDPO和PPO等方法,提升模型生成質量、邏輯推理能力和用戶偏好貼合度。
大模型推理能力的突破與未來
Baichuan-M1系列模型善于通過深度思考解決復雜推理問題,尤其擅長復雜醫療問題的推理。這代表著大模型技術發展的一個新階段,即從單純的預訓練Scaling Law向強化學習Scaling Law的轉變,模型能夠像人類一樣進行系統性的思考,解決更復雜的問題。百川智能選擇醫療領域作為突破口,展現了其挑戰難題、推動AI技術進步的決心。
聯系作者
文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺