AIGC動態歡迎閱讀
原標題:百川智能發布超千億大模型Baichuan 3,中文評測超越GPT-4
關鍵字:模型,解讀,醫療,智能,數據
文章來源:AI前線
內容字數:7001字
內容摘要:
作者 | 褚杏娟
1 月 29 日,百川智能發布超千億參數的大語言模型 Baichuan 3。
在多個權威通用能力評測如 CMMLU、GAOKAO 和 AGI-Eval 中,Baichuan 3 都展現了出色的能力,尤其在中文任務上更是超越了 GPT-4。而在數學和代碼專項評測如 MATH、HumanEval 和 MBPP 中同樣表現出色,證明了 Baichuan 3 在自然語言處理和代碼生成領域的強大實力。
不僅如此,其在對邏輯推理能力及專業性要求極高的 MCMLE、MedExam、CMExam 等權威醫療評測上的中文效果同樣超過了 GPT-4,是中文醫療任務表現最佳的大模型。Baichuan 3 還突破“迭代式強化學習”技術,進一步提升了語義理解和生成能力,在詩詞創作的格式、韻律、表意等方面表現優異,領先于其他大模型。
鏈接:https://www.baichuan-ai.com/百川智能做了哪些改進與百億、幾百億級別參數模型訓練不同,超千億參數模型在訓練過程中對高質量數據,訓練穩定性、訓練效率的要求都高出幾個量級。為解決相關問題,百川智能在訓練過程中針對性地提出了“動態數據選擇”
原文鏈接:百川智能發布超千億大模型Baichuan 3,中文評測超越GPT-4
聯系作者
文章來源:AI前線
作者微信:ai-front
作者簡介:面向AI愛好者、開發者和科學家,提供AI領域技術資訊、一線業界實踐案例、搜羅整理業界技術分享干貨、AI論文解讀。每周一節技術分享公開課,助力你全面擁抱人工智能技術。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...