探索NeurIPS 2024:突破性數據集助力云層去除、化學光譜分析與自動駕駛革新
內含 9 個數據集下載鏈接
原標題:NeurIPS 2024 數據集匯總|覆蓋云層去除/化學光譜/歌聲音頻/自動駕駛/昆蟲標本······
文章來源:HyperAI超神經
內容字數:5113字
NeurIPS 2024 數據集匯總
根據李姝的報道,HyperAI超神經從NeurIPS 2024會議中整理并分享了9個高質量的開源數據集,涵蓋云層去除、化學光譜、歌聲音頻、自動駕駛、昆蟲標本等多個領域。這些數據集為研究者提供了豐富的資源,幫助推動相關領域的研究進展。
1. AllClear 公共云層去除數據集
發布機構:康奈爾大學、哥倫比亞大學
預估大小:22.42 GB
下載地址:點擊這里
AllClear是目前最大的公共云層去除數據集,包含23,742個全球分布的興趣區域(ROIs),共計400萬張圖像,旨在解決云層對下游應用的影響。
2. Muharaf 手寫文數據集
發布機構:北卡羅來納州立大學等
預估大小:9.83 GB
下載地址:點擊這里
該數據集專注于手寫文識別,包含超過1.6k張歷史手寫頁面圖像,促進手寫文本識別技術的發展。
3. 化學多模光譜數據集
發布機構:IBM Research等
預估大小:9.7 GB
下載地址:點擊這里
該數據集匯集79萬種分子的多種光譜數據,旨在通過自動化結構解析簡化分子發現流程。
4. GTSinger 歌聲音頻數據集
發布機構:浙江大學
預估大小:28.94 GB
下載地址:點擊這里
包含80.59小時的歌聲錄音,涵蓋多種語言,為音色和風格研究提供了豐富的資源。
5. DrivingDojo 自動駕駛數據集
發布機構:中國科學院等
下載地址:點擊這里
該數據集包含約18k個視頻片段,旨在提升復雜駕駛環境中的預測和控制能力。
6. 多模態昆蟲生物多樣性數據集
發布機構:生物多樣性基因組學中心等
預估大小:37.71 GB
下載地址:點擊這里
包含超過500萬昆蟲標本的詳細信息,旨在監測全球昆蟲生物多樣性。
7. OpenSatMap 高分辨率衛星數據集
發布機構:中國科學院等
預估大小:57.7 GB
下載地址:點擊這里
該數據集專為大規模地圖構建而設計,包含3,787張高分辨率衛星圖像。
8. 自然物種聲音數據集
發布機構:馬薩諸塞大學等
預估大小:131.26 GB
下載地址:點擊這里
收錄230,000個音頻文件,涵蓋鳥類、哺乳動物等多個物種的聲音。
9. MINT-1T 文本圖像對多模態數據集
發布機構:華盛頓大學等
下載地址:點擊這里
該數據集規模龐大,包含1萬億個文本標記和34億張圖像,為科學文檔研究提供了豐富的數據資源。
以上是HyperAI超神經為大家匯總的NeurIPS 2024數據集,若有意向收錄其他資源,歡迎留言或投稿。欲了解更多信息,請訪問HyperAI超神經官網。
聯系作者
文章來源:HyperAI超神經
作者微信:
作者簡介:解構技術先進性與普適性,報道更前沿的 AIforScience 案例