2024 Meet AI Compiler 北京線下聚會(huì)定檔!千萬級(jí)指令微調(diào)數(shù)據(jù)集 InfinityInstruct 開源
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:2024 Meet AI Compiler 北京線下聚會(huì)定檔!千萬級(jí)指令微調(diào)數(shù)據(jù)集 InfinityInstruct 開源
關(guān)鍵字:解讀,數(shù)據(jù),報(bào)告,模型,圖像
文章來源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
高質(zhì)量的指令數(shù)據(jù)是訓(xùn)練和優(yōu)化大語言模型不可或缺的資源,是提升模型性能的基石。近日,北京智源人工智能研究院發(fā)布了千萬級(jí)高質(zhì)量指令微調(diào)數(shù)據(jù)集開源項(xiàng)目 InfinityInstruct ,包括基于開源數(shù)據(jù)集進(jìn)行高質(zhì)量篩選的數(shù)據(jù),和通過數(shù)據(jù)合成方法構(gòu)造的高質(zhì)量指令數(shù)據(jù)。
本次大會(huì)開源了首批 300 萬條經(jīng)過模型驗(yàn)證的高質(zhì)量中英文指令數(shù)據(jù)集 InfInstruct-3M,現(xiàn)已上線 hyper.ai 官網(wǎng)。大家可以使用該數(shù)據(jù)集,再結(jié)合自有應(yīng)用數(shù)據(jù)微調(diào)基礎(chǔ)模型,即可快速打造高質(zhì)量專屬中英雙語對(duì)話模型。
6 月 10 日-6 月 14 日,hyper.ai 官網(wǎng)更新速覽:
* 優(yōu)質(zhì)公共數(shù)據(jù)集:10 個(gè)
*優(yōu)質(zhì)教程精選:2 個(gè)
* 社區(qū)文章精選:4 篇
* 熱門百科詞條:5 條
* 6-7 月截稿頂會(huì):5 個(gè)
訪問官網(wǎng):hyper.ai公共數(shù)據(jù)集精選1.InfInstruct-3M 啟動(dòng)千萬級(jí)指令微調(diào)數(shù)據(jù)集
該數(shù)據(jù)集是由北京智源人工智能研究院推出的,該項(xiàng)目的目標(biāo)是開發(fā)一個(gè)包含數(shù)百萬條指令的數(shù)據(jù)集,以支持大型語言模型的指令跟蹤能力,進(jìn)而提升模型性能。此版本為 InfinityInstruct-3M 指令數(shù)
原文鏈接:2024 Meet AI Compiler 北京線下聚會(huì)定檔!千萬級(jí)指令微調(diào)數(shù)據(jù)集 InfinityInstruct 開源
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:HyperAI
作者簡介:解構(gòu)技術(shù)先進(jìn)性與普適性,報(bào)道更前沿的 AIforScience 案例