人類嬰兒由于出生時(shí)過于虛弱,不具備主動(dòng)接近成人的行為能力,因此在9個(gè)月之前,其主要通過哭聲吸引成人的注意,并向成人表達(dá)他的需求。嬰幼兒語料庫是按照一定采樣標(biāo)準(zhǔn)采集的電子數(shù)據(jù)集合,隨著大數(shù)據(jù)時(shí)代的到來,語音智能產(chǎn)品已經(jīng)滲透到移動(dòng)通信、智能家居、工業(yè)生產(chǎn)等很多領(lǐng)域。語音識(shí)別技術(shù)逐漸趨于成熟,然而,語音識(shí)別產(chǎn)品所依賴的語音數(shù)據(jù)價(jià)值變得更加顯著,語料庫成為重要的基礎(chǔ)資源。獨(dú)有核心技術(shù),讓AI更進(jìn)一步。 本語料庫采集了近十六萬條語音。錄音采集人來自中國大陸各地,錄制人數(shù)300多人,錄制家庭300多家,采取0-14個(gè)月跟蹤家庭錄制,男女比例均衡,音頻總時(shí)長1275小時(shí),采集方式為單麥設(shè)備。每條音頻單獨(dú)存儲(chǔ)為一個(gè)文件,并由專業(yè)標(biāo)注人員手工進(jìn)行兩級(jí)標(biāo)注。所有標(biāo)注數(shù)據(jù)都是全檢后再交付,以保證交付數(shù)據(jù)的質(zhì)量。 |
技術(shù)背景介紹 |
隨著以深度神經(jīng)網(wǎng)絡(luò)為代表的人工智能技術(shù)的發(fā)展,新一輪的人機(jī)交互技術(shù)熱潮正在興起。在機(jī)器視覺領(lǐng)域,由于海量圖像和視覺場景數(shù)據(jù)庫的誕生,催生了人臉識(shí)別、姿態(tài)識(shí)別、自動(dòng)駕駛、無人機(jī)等領(lǐng)域的技術(shù)革新。目前世界上已有的典型的大規(guī)模海量圖像和視覺場景數(shù)據(jù)庫包括,ImageNet、MSCOCO等業(yè)界知名的數(shù)據(jù)庫。 在聲音場景和聲音事件的識(shí)別領(lǐng)域,技術(shù)的發(fā)展已經(jīng)成熟,然而商業(yè)應(yīng)用滯后于機(jī)器視覺領(lǐng)域的應(yīng)用。在聲音領(lǐng)域,目前世界上最著名的音頻數(shù)據(jù)庫包括:歐洲的DCASE(聲音場景和事件數(shù)據(jù)庫)和谷歌的Audio Set(包括各類層次結(jié)構(gòu)化的音頻分類數(shù)據(jù))等。 在家庭環(huán)境領(lǐng)域,能夠用來服務(wù)于AI應(yīng)用的聲音數(shù)據(jù)極為缺乏,本產(chǎn)品旨在填補(bǔ)這一空白,為全球的智能家庭環(huán)境的AI應(yīng)用落地做出貢獻(xiàn)。 聲音場景(Acoustic Scene)指的是室內(nèi)、室外、火車站、餐廳、看電影、聽音樂等實(shí)際生活中人們的有聲的生活場景,通過聲音信號(hào)的識(shí)別來辨識(shí)這類場景,就是聲音場景識(shí)別;聲音事件(Acoustic Event)指的是根據(jù)短時(shí)聲學(xué)特征,利用統(tǒng)計(jì)學(xué)習(xí)的建模方法,對(duì)不同的聲源所關(guān)聯(lián)的事件,進(jìn)行類別的分類。例如,對(duì)哭聲、咳嗽聲、腳步聲,能夠通過聲音頻率特征的分布規(guī)律,進(jìn)行實(shí)時(shí)的檢測,發(fā)現(xiàn)家居環(huán)境中的突發(fā)性事件、嬰幼兒的行為事件、家庭成員的異常活動(dòng)等。 |
數(shù)據(jù)應(yīng)用場景 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
【家庭環(huán)境嬰幼兒聲音場景和聲音事件數(shù)據(jù)庫】作為豐富的數(shù)據(jù)資源,可用于哭聲及家庭環(huán)境聲音頻率和特征的分析學(xué)習(xí),研究聲環(huán)境及其同人類活動(dòng)的相互作用,更好的滿足了多種場景的人工智能研發(fā)數(shù)據(jù)支撐。也為嬰幼兒智能產(chǎn)品的創(chuàng)新和研發(fā),尤其為互聯(lián)網(wǎng)行業(yè)、母嬰行業(yè)、智能家居行業(yè)提供了更詳細(xì)的數(shù)據(jù)和更全面的信息支持。 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
產(chǎn)品優(yōu)勢 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
l 領(lǐng)先的語音采集處理技術(shù)及專業(yè)標(biāo)注團(tuán)隊(duì); l 同時(shí)支持科研和教學(xué); l 支持可視化操作; l 支持基于機(jī)器學(xué)習(xí)的智能分析; l 支持科研需求定制開發(fā); l 人工校對(duì)、多層級(jí)語音數(shù)據(jù)標(biāo)注; | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
數(shù)據(jù)規(guī)格 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
歡迎光臨 電子工程網(wǎng) (http://www.qingdxww.cn/) | Powered by Discuz! X3.4 |