「汪汪」to Vector!密歇根博士生用AI解碼狗的聲音 | LREC 2024
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:「汪汪」to Vector!密歇根博士生用AI解碼狗的聲音 | LREC 2024
關(guān)鍵字:模型,數(shù)據(jù),品種,研究人員,叫聲
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:alan
【新智元導(dǎo)讀】近日,來(lái)自密歇根大學(xué)的研究人員,開(kāi)發(fā)了一款人工智能工具,可以區(qū)分不同含義的狗叫聲,并識(shí)別狗的年齡、性別和品種。有沒(méi)有想過(guò)你的狗狗想要對(duì)你說(shuō)什么?
在科幻或者想象的場(chǎng)景中,人類有時(shí)會(huì)編織類似的情節(jié)。
然而在AI風(fēng)行之下,科幻已然到來(lái)!
狗的語(yǔ)言也是「自然語(yǔ)言」,人的語(yǔ)言能word to vector,「汪汪」為什么不行?
近日,就有研究人員開(kāi)發(fā)了一款人工智能工具,可以區(qū)分不同含義的狗叫聲,并識(shí)別狗的年齡、性別和品種。
論文地址:https://arxiv.org/pdf/2404.18739
而且,研究結(jié)果表明,源自人類語(yǔ)音的聲音和模式,可以作為分析和理解其他聲音(例如動(dòng)物發(fā)聲)聲學(xué)模式的基礎(chǔ)。
研究者來(lái)自密歇根大學(xué),以及墨西哥國(guó)家天體物理、光學(xué)和電子研究所(INAOE)。
該篇工作同時(shí)發(fā)表在International Conference on Computational Linguistics, Language Resources and Evaluation上。
這是一作Artem Abzaliev,和他的狗Nova:
——以前是遇事不決
原文鏈接:「汪汪」to Vector!密歇根博士生用AI解碼狗的聲音 | LREC 2024
聯(lián)系作者
文章來(lái)源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。