2024 Meet AI Compiler 北京線下聚會定檔!千萬級指令微調數據集 InfinityInstruct 開源
AIGC動態歡迎閱讀
原標題:2024 Meet AI Compiler 北京線下聚會定檔!千萬級指令微調數據集 InfinityInstruct 開源
關鍵字:解讀,數據,報告,模型,圖像
文章來源:HyperAI超神經
內容字數:0字
內容摘要:
高質量的指令數據是訓練和優化大語言模型不可或缺的資源,是提升模型性能的基石。近日,北京智源人工智能研究院發布了千萬級高質量指令微調數據集開源項目 InfinityInstruct ,包括基于開源數據集進行高質量篩選的數據,和通過數據合成方法構造的高質量指令數據。
本次大會開源了首批 300 萬條經過模型驗證的高質量中英文指令數據集 InfInstruct-3M,現已上線 hyper.ai 官網。大家可以使用該數據集,再結合自有應用數據微調基礎模型,即可快速打造高質量專屬中英雙語對話模型。
6 月 10 日-6 月 14 日,hyper.ai 官網更新速覽:
* 優質公共數據集:10 個
*優質教程精選:2 個
* 社區文章精選:4 篇
* 熱門百科詞條:5 條
* 6-7 月截稿頂會:5 個
訪問官網:hyper.ai公共數據集精選1.InfInstruct-3M 啟動千萬級指令微調數據集
該數據集是由北京智源人工智能研究院推出的,該項目的目標是開發一個包含數百萬條指令的數據集,以支持大型語言模型的指令跟蹤能力,進而提升模型性能。此版本為 InfinityInstruct-3M 指令數
原文鏈接:2024 Meet AI Compiler 北京線下聚會定檔!千萬級指令微調數據集 InfinityInstruct 開源
聯系作者
文章來源:HyperAI超神經
作者微信:HyperAI
作者簡介:解構技術先進性與普適性,報道更前沿的 AIforScience 案例
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...