ChildMandarin

ChildMandarin – 智源聯(lián)合南開開源的低幼兒童中文語音數(shù)據(jù)集

ChildMandarin

ChildMandarin 是一個致力于為3至5歲兒童提供普通話語音數(shù)據(jù)集的項目，由智源研究院與南開大學計算機學院的人類語言技術(shù)實驗室（HLT Lab）聯(lián)合開發(fā)。該數(shù)據(jù)集包含41.25小時的語音記錄，來源于397名兒童，涵蓋了中國22個省級行政區(qū)，并且在性別分布上保持均衡。所有數(shù)據(jù)均通過智能手機錄制，確保了音頻的高質(zhì)量。

ChildMandarin是什么

ChildMandarin 是一個專為3至5歲兒童設計的普通話語音數(shù)據(jù)集，由智源研究院與南開大學計算機學院人類語言技術(shù)實驗室（HLT Lab）共同推出。該數(shù)據(jù)集包含41.25小時的語音記錄，涵蓋來自397名兒童的聲音，分布于中國22個省級行政區(qū)，確保了性別的平衡。音頻數(shù)據(jù)使用智能手機錄制，旨在保證高質(zhì)量的錄音體驗。ChildMandarin 的核心特點在于自然交互，通過家長引導式對話的方式來收集數(shù)據(jù)，模擬真實的交流場景。這一數(shù)據(jù)集填補了低幼兒童語音研究的空白，并助力兒童語音識別、語言發(fā)展研究及智能語音交互系統(tǒng)的發(fā)展。

ChildMandarin的主要功能

語音識別：為自動語音識別（ASR）模型提供豐富的3至5歲兒童自然語音數(shù)據(jù)，提升兒童語音識別的準確性與魯棒性。
說話人驗證：支持說話人驗證（SV）任務，有助于識別和區(qū)分不同兒童的聲音，適用于兒童身份認證等場景。
語言研究：為兒童語言發(fā)展研究提供有力的數(shù)據(jù)支持，助力開發(fā)兒童語言學習工具和互動教育系統(tǒng)。

產(chǎn)品官網(wǎng)

GitHub倉庫：https://github.com/flageval-baai/ChildMandarin
HuggingFace模型庫：https://huggingface.co/datasets/BAAI/ChildMandarin
arXiv技術(shù)論文：https://arxiv.org/pdf/2409.18584

ChildMandarin的應用場景

兒童語言學習工具：開發(fā)智能語音輔助工具，幫助兒童學習發(fā)音、詞匯及語法，從而提升語言能力。
互動教育系統(tǒng)：為兒童教育軟件和互動學習平臺提供語音交互功能，讓學習過程更加生動有趣。
智能玩具開發(fā)：增強智能玩具的語音識別能力，更好地理解兒童的語音指令，提升互動體驗。
語音助手優(yōu)化：改進語音助手（如智能音箱、手機助手）對兒童語音的識別和響應，更適合兒童使用。
兒童健康管理：監(jiān)測兒童的語言發(fā)展和健康狀況，為早期干預提供支持。

常見問題

ChildMandarin 數(shù)據(jù)集的目標是什么？ 該數(shù)據(jù)集旨在支持兒童語音識別和語言發(fā)展研究，為相關技術(shù)提供真實的語音數(shù)據(jù)。
如何獲取 ChildMandarin 數(shù)據(jù)集？ 用戶可以通過提供的 GitHub 和 HuggingFace 鏈接訪問和下載數(shù)據(jù)集。
數(shù)據(jù)集的語音質(zhì)量如何？ 所有音頻均由智能手機錄制，確保了高質(zhì)量的音頻體驗。
數(shù)據(jù)集是否適合其他年齡段的兒童？ 該數(shù)據(jù)集專注于3至5歲兒童的語音，可能不適用于其他年齡段的研究。

閱讀原文