智源發(fā)布全球最大中英文向量模型訓(xùn)練數(shù)據(jù)集!規(guī)模高達(dá)3億文本對
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:智源發(fā)布全球最大中英文向量模型訓(xùn)練數(shù)據(jù)集!規(guī)模高達(dá)3億文本對
關(guān)鍵字:報(bào)告,模型,向量,數(shù)據(jù),華為
文章來源:新智元
內(nèi)容字?jǐn)?shù):4467字
內(nèi)容摘要:新智元報(bào)道編輯:好困【新智元導(dǎo)讀】為推動(dòng)大模型開源生態(tài),智源研究院發(fā)布全球最大面向中英文語義向量模型訓(xùn)練數(shù)據(jù)集。9月15日,北京人工智能產(chǎn)業(yè)峰會(huì)暨中關(guān)村科學(xué)城科創(chuàng)大賽頒獎(jiǎng)典禮現(xiàn)場,智源研究院發(fā)布面向中英文語義向量模型訓(xùn)練的大規(guī)模文本對數(shù)據(jù)集MTP(massive text pairs)。這是全球最大的中、英文文本對訓(xùn)練數(shù)據(jù)集,數(shù)據(jù)規(guī)模達(dá)3億對,具有規(guī)模巨大、主題豐富、數(shù)據(jù)質(zhì)量高三大特征,進(jìn)而可以推…
原文鏈接:點(diǎn)此閱讀原文:智源發(fā)布全球最大中英文向量模型訓(xùn)練數(shù)據(jù)集!規(guī)模高達(dá)3億文本對
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺(tái),致力于推動(dòng)中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。