AIGC動態歡迎閱讀
原標題:30 個優質 NLP 數據集和模型,一鍵使用 8 個 demo,建議收藏!| 超全大模型資源匯總
關鍵字:模型,數據,解讀,系列,中文
文章來源:大數據文摘
內容字數:8335字
內容摘要:
大數據文摘受權轉載自HyperAI超神經
近兩年來,大模型的熱度持續高漲,并且開始在更廣泛的領域進行落地探索。隨著行業整體的快速發展,越來越多的開源大模型涌入市場,進一步推動了上層應用的拓展。
對于開發者而言,挑選優質大模型和數據集對其后續的研發、模型微調至關重要。為了方便大家選擇并下載適配開發需求的模型與數據集,HyperAI超神經為大家匯總了大模型相關資源:
* 優質公共數據集:15 個
* 優質開源模型:15 個
*優質教程精選:8 個
更多大模型資源,見官網:hyper.ai數據集精選1.seq-monkey 序列猴子開源數據集 1.0
序列猴子數據集是用于訓練序列猴子模型的數據集,涉及領域包括:中文通用文本語料、古詩今譯語料、文本生成語料。
直接使用:https://my5353.com/seqmon
2.IEPile 大規模信息抽取語料庫
IEPile 是由浙江大學研發的大規模、高質量的雙語(中英)信息抽取 (IE) 指令微調數據集,涵蓋了醫學、金融等多個領域。
直接使用:https://my5353.com/30064
3.LongAlign-10K 大模型長上下文對齊數
原文鏈接:30 個優質 NLP 數據集和模型,一鍵使用 8 個 demo,建議收藏!| 超全大模型資源匯總
聯系作者
文章來源:大數據文摘
作者微信:BigDataDigest
作者簡介:普及數據思維,傳播數據文化
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...