超全大模型資源匯總|30 個(gè)優(yōu)質(zhì) NLP 數(shù)據(jù)集和模型,一鍵使用 8 個(gè) demo,建議收藏!
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:超全大模型資源匯總|30 個(gè)優(yōu)質(zhì) NLP 數(shù)據(jù)集和模型,一鍵使用 8 個(gè) demo,建議收藏!
關(guān)鍵字:模型,數(shù)據(jù),解讀,中文,系列
文章來(lái)源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):12920字
內(nèi)容摘要:
近兩年來(lái),大模型的熱度持續(xù)高漲,并且開(kāi)始在更廣泛的領(lǐng)域進(jìn)行落地探索。隨著行業(yè)整體的快速發(fā)展,越來(lái)越多的開(kāi)源大模型涌入市場(chǎng),進(jìn)一步推動(dòng)了上層應(yīng)用的拓展。
對(duì)于開(kāi)發(fā)者而言,挑選優(yōu)質(zhì)大模型和數(shù)據(jù)集對(duì)其后續(xù)的研發(fā)、模型微調(diào)至關(guān)重要。為了方便大家選擇并下載適配開(kāi)發(fā)需求的模型與數(shù)據(jù)集,HyperAI超神經(jīng)為大家匯總了大模型相關(guān)資源:
* 優(yōu)質(zhì)公共數(shù)據(jù)集:15 個(gè)
* 優(yōu)質(zhì)開(kāi)源模型:15 個(gè)
*優(yōu)質(zhì)教程精選:8 個(gè)
獲取更多大模型資源,請(qǐng)?jiān)L問(wèn)官網(wǎng):hyper.ai數(shù)據(jù)集精選1.seq-monkey 序列猴子開(kāi)源數(shù)據(jù)集 1.0
序列猴子數(shù)據(jù)集是用于訓(xùn)練序列猴子模型的數(shù)據(jù)集,涉及領(lǐng)域包括:中文通用文本語(yǔ)料、古詩(shī)今譯語(yǔ)料、文本生成語(yǔ)料。
直接使用:https://my5353.com/seqmon
2.IEPile 大規(guī)模信息抽取語(yǔ)料庫(kù)
IEPile 是由浙江大學(xué)研發(fā)的大規(guī)模、高質(zhì)量的雙語(yǔ)(中英)信息抽取 (IE) 指令微調(diào)數(shù)據(jù)集,涵蓋了醫(yī)學(xué)、金融等多個(gè)領(lǐng)域。
直接使用:https://my5353.com/30064
3.LongAlign-10K 大模型長(zhǎng)上下文對(duì)齊數(shù)據(jù)集
LongAlign-10k
原文鏈接:超全大模型資源匯總|30 個(gè)優(yōu)質(zhì) NLP 數(shù)據(jù)集和模型,一鍵使用 8 個(gè) demo,建議收藏!
聯(lián)系作者
文章來(lái)源:HyperAI超神經(jīng)
作者微信:HyperAI
作者簡(jiǎn)介:解構(gòu)技術(shù)先進(jìn)性與普適性,解讀更前沿的 AIForScience 案例