国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

電子工程網(wǎng)

標(biāo)題: AVS-H嬰幼兒語料庫 [打印本頁]

作者: avsnest 時(shí)間: 2018-6-26 10:26
標(biāo)題: AVS-H嬰幼兒語料庫

人類嬰兒由于出生時(shí)過于虛弱，不具備主動(dòng)接近成人的行為能力，因此在9個(gè)月之前，其主要通過哭聲吸引成人的注意，并向成人表達(dá)他的需求。嬰幼兒語料庫是按照一定采樣標(biāo)準(zhǔn)采集的電子數(shù)據(jù)集合，隨著大數(shù)據(jù)時(shí)代的到來，語音智能產(chǎn)品已經(jīng)滲透到移動(dòng)通信、智能家居、工業(yè)生產(chǎn)等很多領(lǐng)域。語音識(shí)別技術(shù)逐漸趨于成熟，然而，語音識(shí)別產(chǎn)品所依賴的語音數(shù)據(jù)價(jià)值變得更加顯著，語料庫成為重要的基礎(chǔ)資源。獨(dú)有核心技術(shù)，讓AI更進(jìn)一步。

本語料庫采集了近十六萬條語音。錄音采集人來自中國大陸各地，錄制人數(shù)300多人，錄制家庭300多家，采取0-14個(gè)月跟蹤家庭錄制，男女比例均衡，音頻總時(shí)長1275小時(shí)，采集方式為單麥設(shè)備。每條音頻單獨(dú)存儲(chǔ)為一個(gè)文件，并由專業(yè)標(biāo)注人員手工進(jìn)行兩級(jí)標(biāo)注。所有標(biāo)注數(shù)據(jù)都是全檢后再交付，以保證交付數(shù)據(jù)的質(zhì)量。

技術(shù)背景介紹

隨著以深度神經(jīng)網(wǎng)絡(luò)為代表的人工智能技術(shù)的發(fā)展，新一輪的人機(jī)交互技術(shù)熱潮正在興起。在機(jī)器視覺領(lǐng)域，由于海量圖像和視覺場景數(shù)據(jù)庫的誕生，催生了人臉識(shí)別、姿態(tài)識(shí)別、自動(dòng)駕駛、無人機(jī)等領(lǐng)域的技術(shù)革新。目前世界上已有的典型的大規(guī)模海量圖像和視覺場景數(shù)據(jù)庫包括，ImageNet、MSCOCO等業(yè)界知名的數(shù)據(jù)庫。

在聲音場景和聲音事件的識(shí)別領(lǐng)域，技術(shù)的發(fā)展已經(jīng)成熟，然而商業(yè)應(yīng)用滯后于機(jī)器視覺領(lǐng)域的應(yīng)用。在聲音領(lǐng)域，目前世界上最著名的音頻數(shù)據(jù)庫包括：歐洲的DCASE（聲音場景和事件數(shù)據(jù)庫）和谷歌的Audio Set（包括各類層次結(jié)構(gòu)化的音頻分類數(shù)據(jù)）等。

在家庭環(huán)境領(lǐng)域，能夠用來服務(wù)于AI應(yīng)用的聲音數(shù)據(jù)極為缺乏，本產(chǎn)品旨在填補(bǔ)這一空白，為全球的智能家庭環(huán)境的AI應(yīng)用落地做出貢獻(xiàn)。

聲音場景（Acoustic Scene）指的是室內(nèi)、室外、火車站、餐廳、看電影、聽音樂等實(shí)際生活中人們的有聲的生活場景，通過聲音信號(hào)的識(shí)別來辨識(shí)這類場景，就是聲音場景識(shí)別；聲音事件（Acoustic Event）指的是根據(jù)短時(shí)聲學(xué)特征，利用統(tǒng)計(jì)學(xué)習(xí)的建模方法，對(duì)不同的聲源所關(guān)聯(lián)的事件，進(jìn)行類別的分類。例如，對(duì)哭聲、咳嗽聲、腳步聲，能夠通過聲音頻率特征的分布規(guī)律，進(jìn)行實(shí)時(shí)的檢測，發(fā)現(xiàn)家居環(huán)境中的突發(fā)性事件、嬰幼兒的行為事件、家庭成員的異常活動(dòng)等。

數(shù)據(jù)應(yīng)用場景

【家庭環(huán)境嬰幼兒聲音場景和聲音事件數(shù)據(jù)庫】作為豐富的數(shù)據(jù)資源，可用于哭聲及家庭環(huán)境聲音頻率和特征的分析學(xué)習(xí)，研究聲環(huán)境及其同人類活動(dòng)的相互作用，更好的滿足了多種場景的人工智能研發(fā)數(shù)據(jù)支撐。也為嬰幼兒智能產(chǎn)品的創(chuàng)新和研發(fā)，尤其為互聯(lián)網(wǎng)行業(yè)、母嬰行業(yè)、智能家居行業(yè)提供了更詳細(xì)的數(shù)據(jù)和更全面的信息支持。

產(chǎn)品優(yōu)勢

l 領(lǐng)先的語音采集處理技術(shù)及專業(yè)標(biāo)注團(tuán)隊(duì)；

l 同時(shí)支持科研和教學(xué)；

l 支持可視化操作；

l 支持基于機(jī)器學(xué)習(xí)的智能分析；

l 支持科研需求定制開發(fā)；

l 人工校對(duì)、多層級(jí)語音數(shù)據(jù)標(biāo)注；

數(shù)據(jù)規(guī)格

數(shù)據(jù)規(guī)格
符合 LDC（Linguistic Data Consortium）國際語義數(shù)據(jù)聯(lián)盟推薦規(guī)范
采集內(nèi)容	家庭環(huán)境嬰幼兒聲音場景和聲音事件
音頻參數(shù)	Wave PCM signed 16 bit，16000Hz，256kbps，單聲
標(biāo)注內(nèi)容A	哭聲	嬰純強(qiáng)哭
		嬰純中哭
		嬰純?nèi)蹩?/div>
		嬰混音哭
		嬰模糊哭
		非嬰哭
	笑聲
	咳嗽聲
	噴嚏聲
	尖叫聲
	嬰其他聲
	公共聲音
標(biāo)注內(nèi)容B	嬰兒聲
	純?nèi)寺?/div>
	純兒歌聲
	純環(huán)境聲
	其它公共
采集設(shè)備	單麥設(shè)備
產(chǎn)品特點(diǎn)	0-14個(gè)月齡段錄音，男、女標(biāo)注
存儲(chǔ)方式
文件格式	Lf0 二進(jìn)制數(shù)據(jù)文件
文件時(shí)長	1275小時(shí)
數(shù)據(jù)脫敏
數(shù)據(jù)敏感項(xiàng)	無
脫敏操作	無
志愿者家庭隱私免責(zé)協(xié)議	有
產(chǎn)品應(yīng)用
適用領(lǐng)域	聲信號(hào)識(shí)別，聲音事件分析，人工智能應(yīng)用
版權(quán)歸屬
版權(quán)所有者	深圳聲聯(lián)網(wǎng)科技有限公司

歡迎光臨電子工程網(wǎng) (http://www.qingdxww.cn/)