【數(shù)學(xué)數(shù)據(jù)集匯總】天才博士陶哲軒力薦數(shù)據(jù)集!含代碼、中文競賽題目、正向逆向問答對等
AIGC動態(tài)歡迎閱讀
原標(biāo)題:【數(shù)學(xué)數(shù)據(jù)集匯總】天才博士陶哲軒力薦數(shù)據(jù)集!含代碼、中文競賽題目、正向逆向問答對等
關(guān)鍵字:數(shù)據(jù),數(shù)學(xué),華為,解讀,機(jī)構(gòu)
文章來源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):5403字
內(nèi)容摘要:
上周,著名數(shù)學(xué)家陶哲軒在個人博客中發(fā)布了「AI for Math Resourses」的資源清單,旨在為那些有意進(jìn)入人工智能數(shù)學(xué)領(lǐng)域的人提供幫助,這份清單由「人工智能輔助數(shù)學(xué)推理」研討會整理。該研討會由美國國家科學(xué)院、工程院和醫(yī)學(xué)院共同組織,陶哲軒擔(dān)任該研討會的主持人。
這份清單文檔尚未最終定稿,陶哲軒及其他研究者仍在不斷完善中。HyperAI超神經(jīng)從中篩選出了部分?jǐn)?shù)據(jù)集供大家下載使用,除此之外,還為大家補(bǔ)充匯總了其他數(shù)學(xué)方面的數(shù)據(jù)集,助力 AI for Math。1OpenWebMath 網(wǎng)絡(luò)數(shù)學(xué)數(shù)據(jù)集發(fā)布機(jī)構(gòu):多倫多大學(xué)、劍橋大學(xué)等
發(fā)布時間:2023 年
預(yù)估大小:44.21 GB
下載地址:https://go.hyper.ai/erQGZ
OpenWebMath 包含了來自互聯(lián)網(wǎng)的大部分高質(zhì)量數(shù)學(xué)文本。它是從 Common Crawl 上超過 200B 個 HTML 文件中過濾和提取的,最終形成一組 630 萬個文檔,總共包含 14.7B 個 tokens。2Ape210K 中國小學(xué)水平數(shù)學(xué)問題發(fā)布機(jī)構(gòu):猿輔導(dǎo) AI Lab、西北大學(xué)
發(fā)布時間:2020 年
預(yù)估大小:78.
原文鏈接:【數(shù)學(xué)數(shù)據(jù)集匯總】天才博士陶哲軒力薦數(shù)據(jù)集!含代碼、中文競賽題目、正向逆向問答對等
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:HyperAI
作者簡介:解構(gòu)技術(shù)先進(jìn)性與普適性,解讀更前沿的 AIForScience 案例