百川發(fā)布超千億大模型 Baichuan 3:多項(xiàng)中文任務(wù)評(píng)測(cè)超 GPT-4、中文醫(yī)療任務(wù)最佳大模型
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:百川發(fā)布超千億大模型 Baichuan 3:多項(xiàng)中文任務(wù)評(píng)測(cè)超 GPT-4、中文醫(yī)療任務(wù)最佳大模型
關(guān)鍵字:模型,醫(yī)療,能力,數(shù)據(jù),智能
文章來(lái)源:Founder Park
內(nèi)容字?jǐn)?shù):7944字
內(nèi)容摘要:
1 月 29 日,百川智能發(fā)布超千億參數(shù)的大模型 Baichuan 3,除了在多個(gè)通用能力測(cè)試中表現(xiàn)出色,尤其是中文任務(wù)超越 GPT-4 以外,這次 Baichuan 3 在專業(yè)性要求極高的 MCMLE、MedExam、CMExam 等權(quán)威醫(yī)療評(píng)測(cè)上的中文效果也超過了 GPT-4,是中文醫(yī)療任務(wù)表現(xiàn)最佳的大模型。
Baichuan 3 還突破「迭代式強(qiáng)化學(xué)習(xí)」技術(shù),進(jìn)一步提升了語(yǔ)義理解和生成能力,在詩(shī)詞創(chuàng)作的格式、韻律、表意等方面表現(xiàn)優(yōu)異,領(lǐng)先于其他大模型。
以下是關(guān)于本次發(fā)布的詳細(xì)內(nèi)容,內(nèi)容來(lái)自于百川智能官方稿件。01基礎(chǔ)能力全面提升多項(xiàng)權(quán)威評(píng)測(cè)中文任務(wù)成績(jī)超越 GPT-4Baichuan 3 在多個(gè)英文評(píng)測(cè)中表現(xiàn)出色,達(dá)到接近 GPT-4 的水平。而在 CMMLU、GAOKAO 等多個(gè)中文評(píng)測(cè)榜單上,更是超越 GPT-4 展現(xiàn)了其在中文任務(wù)上的優(yōu)勢(shì)。
此外,在 MT-Bench、IFEval 等對(duì)齊榜單的評(píng)測(cè)中,Baichuan 3 超越了 GPT-3.5、Claude 等大模型,處于行業(yè)領(lǐng)先水平。
與百億、幾百億級(jí)別參數(shù)模型訓(xùn)練不同,超千億參數(shù)模型在訓(xùn)練過程中對(duì)高質(zhì)量數(shù)據(jù),訓(xùn)練穩(wěn)
原文鏈接:百川發(fā)布超千億大模型 Baichuan 3:多項(xiàng)中文任務(wù)評(píng)測(cè)超 GPT-4、中文醫(yī)療任務(wù)最佳大模型
聯(lián)系作者
文章來(lái)源:Founder Park
作者微信:Founder-Park
作者簡(jiǎn)介:來(lái)自極客公園,專注與科技創(chuàng)業(yè)者聊「真問題」。
相關(guān)文章
