Pile是一個825 GiB的多樣化、開源的語言建模數據集,由22個較小的高質量數據集組合而成,可用于訓練大規模的語言模型,提升模型的泛化能力和跨領域知識。,The Pile官網入口網址
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙