【數學數據集匯總】天才博士陶哲軒力薦數據集!含代碼、中文競賽題目、正向逆向問答對等
AIGC動態歡迎閱讀
原標題:【數學數據集匯總】天才博士陶哲軒力薦數據集!含代碼、中文競賽題目、正向逆向問答對等
關鍵字:數據,數學,華為,解讀,機構
文章來源:HyperAI超神經
內容字數:5403字
內容摘要:
上周,著名數學家陶哲軒在個人博客中發布了「AI for Math Resourses」的資源清單,旨在為那些有意進入人工智能數學領域的人提供幫助,這份清單由「人工智能輔助數學推理」研討會整理。該研討會由美國國家科學院、工程院和醫學院共同組織,陶哲軒擔任該研討會的主持人。
這份清單文檔尚未最終定稿,陶哲軒及其他研究者仍在不斷完善中。HyperAI超神經從中篩選出了部分數據集供大家下載使用,除此之外,還為大家補充匯總了其他數學方面的數據集,助力 AI for Math。1OpenWebMath 網絡數學數據集發布機構:多倫多大學、劍橋大學等
發布時間:2023 年
預估大小:44.21 GB
下載地址:https://go.hyper.ai/erQGZ
OpenWebMath 包含了來自互聯網的大部分高質量數學文本。它是從 Common Crawl 上超過 200B 個 HTML 文件中過濾和提取的,最終形成一組 630 萬個文檔,總共包含 14.7B 個 tokens。2Ape210K 中國小學水平數學問題發布機構:猿輔導 AI Lab、西北大學
發布時間:2020 年
預估大小:78.
原文鏈接:【數學數據集匯總】天才博士陶哲軒力薦數據集!含代碼、中文競賽題目、正向逆向問答對等
聯系作者
文章來源:HyperAI超神經
作者微信:HyperAI
作者簡介:解構技術先進性與普適性,解讀更前沿的 AIForScience 案例
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...