日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的特征補(bǔ)償方法

文檔序號(hào):2833635閱讀:322來(lái)源:國(guó)知局
專利名稱:語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的特征補(bǔ)償方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的特征補(bǔ)償方法,具體涉及到 用一個(gè)含有較少高斯單元的高斯混合模型快速估計(jì)噪聲參數(shù),用一個(gè)含有較多高斯單元的 高斯混合模型從含噪測(cè)試語(yǔ)音中估計(jì)純凈語(yǔ)音特征向量的特征補(bǔ)償方法,屬于語(yǔ)音識(shí)別技 術(shù)領(lǐng)域。
背景技術(shù)
目前,語(yǔ)音識(shí)別系統(tǒng)在實(shí)驗(yàn)室理想環(huán)境下已經(jīng)取得了很好的性能。然而,在實(shí)際環(huán) 境中,背景噪聲和信道失真往往是不可避免的,它們會(huì)導(dǎo)致實(shí)際應(yīng)用環(huán)境中提取的特征向 量與預(yù)先訓(xùn)練的聲學(xué)模型嚴(yán)重失配,識(shí)別器的性能會(huì)急劇惡化,甚至有可能完全失效。因 此,研究語(yǔ)音識(shí)別的環(huán)境補(bǔ)償技術(shù),減小環(huán)境失配對(duì)語(yǔ)音識(shí)別系統(tǒng)的影響,提高語(yǔ)音識(shí)別系 統(tǒng)在實(shí)際環(huán)境中的性能,具有非常重要的意義。
一般來(lái)說,環(huán)境補(bǔ)償技術(shù)可劃分為前端特征補(bǔ)償和后端模型補(bǔ)償。特征補(bǔ)償對(duì)測(cè) 試環(huán)境下的語(yǔ)音特征進(jìn)行補(bǔ)償,使之與訓(xùn)練環(huán)境下的聲學(xué)模型相匹配。模型補(bǔ)償對(duì)訓(xùn)練環(huán) 境下的聲學(xué)模型進(jìn)行調(diào)整,使之與測(cè)試環(huán)境相匹配,直接對(duì)測(cè)試語(yǔ)音進(jìn)行識(shí)別。與后端模型 補(bǔ)償相比,前端特征補(bǔ)償技術(shù)具有計(jì)算量小、實(shí)現(xiàn)靈活、與后端識(shí)別器無(wú)關(guān)的優(yōu)點(diǎn),因而其 應(yīng)用范圍更為廣泛。
在實(shí)際應(yīng)用中,難以保證每段測(cè)試語(yǔ)音都有足夠多的靜音幀來(lái)估計(jì)噪聲參數(shù)。為 了及時(shí)跟蹤環(huán)境的變化,往往需要從含噪測(cè)試語(yǔ)音中提取噪聲參數(shù)。然而,訓(xùn)練環(huán)境與測(cè)試 環(huán)境之間的環(huán)境變換關(guān)系是非線性的,噪聲參數(shù)沒有閉式解。矢量泰勒級(jí)數(shù)(VTS = Vector Taylor Series)是一種有效的噪聲魯棒技術(shù),可以很好地逼近由噪聲導(dǎo)致的非線性環(huán)境變 換關(guān)系。但是基于VTS的噪聲參數(shù)估計(jì)涉及較多的矩陣運(yùn)算,其計(jì)算量與語(yǔ)音模型的高斯 單元數(shù)目成正比。由于在特征補(bǔ)償中,用于噪聲估計(jì)的語(yǔ)音模型同時(shí)也用于估計(jì)純凈語(yǔ)音 特征向量。為了充分描述語(yǔ)音的分布,保證純凈語(yǔ)音估計(jì)的精度,用于特征補(bǔ)償?shù)恼Z(yǔ)音模型 必須包含足夠多的高斯單元。因而,基于VTS的特征補(bǔ)償方法的計(jì)算量較大,難以在嵌入式 系統(tǒng)等獨(dú)立終端上實(shí)時(shí)實(shí)現(xiàn)。發(fā)明內(nèi)容
發(fā)明目的針對(duì)現(xiàn)有技術(shù)中存在的問題與不足,本發(fā)明提供一種語(yǔ)音識(shí)別系統(tǒng)中 基于快速噪聲估計(jì)的特征補(bǔ)償方法。
技術(shù)方案一種語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的特征補(bǔ)償方法,其主要特點(diǎn) 是將特征補(bǔ)償中的噪聲參數(shù)估計(jì)和純凈語(yǔ)音估計(jì)分離開來(lái),噪聲估計(jì)和純凈語(yǔ)音估計(jì)用不 同的高斯混合模型(GMM:Gaussian Mixture Model)實(shí)現(xiàn)。一個(gè)含有較少高斯單元的高斯 混合模型GMM用于從含噪測(cè)試語(yǔ)音中提取噪聲參數(shù);另一個(gè)含有較多高斯單元的高斯混 合模型GMM用于與估得的單高斯噪聲模型進(jìn)行模型組合,得到與當(dāng)前測(cè)試環(huán)境匹配的含噪 GMM;最后用含噪GMM計(jì)算含噪測(cè)試語(yǔ)音的后驗(yàn)概率,用最小均方誤差(MMSE:Minimum MeanSquared Error)方法從含噪測(cè)試語(yǔ)音中估計(jì)純凈語(yǔ)音特征向量。
語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的特征補(bǔ)償方法,具體包括訓(xùn)練階段和測(cè)試階 段兩個(gè)部分;
訓(xùn)練階段的具體步驟包括
(I)從純凈訓(xùn)練語(yǔ)音中提取純凈語(yǔ)音特征向量,采用美爾頻率倒譜系數(shù) (MFCC:Mel-Frequency Cepstral Coefficients)作為語(yǔ)音的特征參數(shù);
(2)用全部訓(xùn)練語(yǔ)音的MFCC進(jìn)行GMM訓(xùn)練,生成兩個(gè)GMM:第一 GMM含有較少的高 斯單元,用于噪聲估計(jì);第二 GMM含有較多的高斯單元,用于模型組合和純凈語(yǔ)音估計(jì);
(3)用每個(gè)基本語(yǔ)音單元的訓(xùn)練語(yǔ)音進(jìn)行聲學(xué)模型訓(xùn)練,生成每個(gè)基本語(yǔ)音單元 的隱馬爾可夫模型(HMM:Hidden Markov Model);
測(cè)試階段的具體步驟包括
(4)從含噪測(cè)試語(yǔ)音中提取含噪語(yǔ)音MFCC ;
(5)用第一 GMM從含噪語(yǔ)音MFCC中提取噪聲參數(shù),包括噪聲的高斯均值向量和協(xié) 方差矩陣;
(6)用估得的噪聲參數(shù)對(duì)第二 GMM的均值和方差進(jìn)行參數(shù)變換,計(jì)算含噪測(cè)試語(yǔ) 音的后驗(yàn)概率,用麗SE方法估計(jì)純凈語(yǔ)音MFCC ;
(7)用每個(gè)語(yǔ)音單元的HMM對(duì)純凈語(yǔ)音MFCC進(jìn)行聲學(xué)解碼,即可得到識(shí)別結(jié)果。
有益效果與現(xiàn)有技術(shù)相比,本發(fā)明提供的語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的 特征補(bǔ)償方法,將特征補(bǔ)償中的噪聲參數(shù)估計(jì)和純凈語(yǔ)音估計(jì)分離開來(lái),噪聲參數(shù)估計(jì)和 純凈語(yǔ)音估計(jì)分別用不同的語(yǔ)音模型實(shí)現(xiàn),可以在減小計(jì)算量的同時(shí),保證純凈語(yǔ)音估計(jì) 的精度。


圖1為本發(fā)明實(shí)施例的基于快速噪聲估計(jì)的特征補(bǔ)償框架;
圖2為本發(fā)明實(shí)施例的基于快速噪聲估計(jì)的語(yǔ)音識(shí)別系統(tǒng)結(jié)構(gòu)。
具體實(shí)施方式
下面結(jié)合具體實(shí)施例,進(jìn)一步闡明本發(fā)明,應(yīng)理解這些實(shí)施例僅用于說明本發(fā)明 而不用于限制本發(fā)明的范圍,在閱讀了本發(fā)明之后,本領(lǐng)域技術(shù)人員對(duì)本發(fā)明的各種等價(jià) 形式的修改均落于本申請(qǐng)所附權(quán)利要求所限定的范圍。
如圖1所示,一個(gè)含有較少高斯單元的高斯混合模型GMMl用于從含噪測(cè)試語(yǔ)音中 提取噪聲參數(shù);另一個(gè)含有較多高斯單元的高斯混合模型GMM2用于與估得的單高斯噪聲 模型進(jìn)行模型組合,得到與當(dāng)前測(cè)試環(huán)境匹配的含噪GMM ;最后用含噪GMM計(jì)算含噪測(cè)試語(yǔ) 音的后驗(yàn)概率,用最小均方誤差方法從含噪測(cè)試語(yǔ)音中估計(jì)純凈語(yǔ)音特征向量。
如圖2所示,基于快速噪聲估計(jì)的特征補(bǔ)償方法主要包括訓(xùn)練階段和測(cè)試階段。 訓(xùn)練階段主要完成GMM訓(xùn)練和HMM訓(xùn)練工作;測(cè)試階段主要完成噪聲參數(shù)估計(jì)和純凈語(yǔ)音 估計(jì)工作。
1、GMM 訓(xùn)練
采用GMM對(duì)語(yǔ)音的分布進(jìn)行建模,用全部訓(xùn)練語(yǔ)音生成兩個(gè)GMM =GMMl和GMM2。GMMl含有較少的高斯單元,用于噪聲估計(jì);GMM2含有較多的高斯單元,用于純凈語(yǔ)音估計(jì)。 GMMl和GMM2的協(xié)方差矩陣均取對(duì)角陣。
2、HMM 訓(xùn)練
本發(fā)明采用連續(xù)密度HMM對(duì)語(yǔ)音識(shí)別的每個(gè)基本語(yǔ)音單元進(jìn)行建模,用每個(gè)基本語(yǔ)音單元的訓(xùn)練語(yǔ)音生成該基本語(yǔ)音單元的HMM。HMM的數(shù)目取決于語(yǔ)音單元的數(shù)目。所有HMM的協(xié)方差矩陣也取對(duì)角陣。
3、噪聲參數(shù)估計(jì)
在倒譜域,含噪語(yǔ)音特征向量y與純凈語(yǔ)音特征向量X的關(guān)系可以表示為
y = x+Clog (1+exp ((T1 (n-χ)))
(I)
其中,η表示加性噪聲倒譜特征向量,C和C—1分別表示離散余弦變換 (DCT!Discrete Cosine Transform)矩陣及其逆矩陣。將式(I)在x的均值P x和η的初始均值μ η(ι附近,用一階VTS展開,得到
權(quán)利要求
1.一種語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的特征補(bǔ)償方法,其特征在于,包括如下步驟(1)采用美爾頻率倒譜系數(shù)作為語(yǔ)音識(shí)別系統(tǒng)的特征參數(shù),特征補(bǔ)償?shù)哪康氖菑暮霚y(cè)試語(yǔ)音中提取純凈語(yǔ)音MFCC ;(2)在訓(xùn)練階段,用高斯混合模型對(duì)語(yǔ)音的分布進(jìn)行建模,用全部訓(xùn)練語(yǔ)音生成兩個(gè) GMM :第一 GMM 和第二 GMM ;(3)用單高斯模型對(duì)背景噪聲進(jìn)行建模,為了實(shí)時(shí)跟蹤環(huán)境的變化,單高斯噪聲模型的均值向量和協(xié)方差矩陣從含噪測(cè)試語(yǔ)音中提??;(4)用第一GMM從含噪測(cè)試語(yǔ)音MFCC中提取噪聲參數(shù),包括噪聲的高斯均值向量和協(xié)方差矩陣;(5)用估得的噪聲參數(shù)對(duì)第二GMM2的均值和方差進(jìn)行參數(shù)變換,即對(duì)單高斯噪聲模型和第二 GMM進(jìn)行模型組合,得到第二 GMM的含噪語(yǔ)音均值和方差;(6)用第二GMM的含噪語(yǔ)音均值和方差計(jì)算含噪測(cè)試語(yǔ)音的后驗(yàn)概率,用最小均方誤差方法估計(jì)純凈語(yǔ)音MFCC ;(7)純凈語(yǔ)音特征向量的一階動(dòng)態(tài)系數(shù)和二階動(dòng)態(tài)系數(shù)不直接從含噪測(cè)試語(yǔ)音中估計(jì),而是通過對(duì)估得的靜態(tài)系數(shù)作時(shí)域差分得到。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的特征補(bǔ)償方法,其特征在于用于噪聲參數(shù)估計(jì)的第一高斯混合模型含有較少的高斯單元,因而其計(jì)算量較小,可以從含噪測(cè)試語(yǔ)音中快速估計(jì)噪聲的均值和方差。
3.根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的特征補(bǔ)償方法,其特征在于用于純凈語(yǔ)音估計(jì)的第二高斯混合模型含有較多的高斯單元,可以充分描述語(yǔ)音的分布,因而可以得到準(zhǔn)確的純凈語(yǔ)音估計(jì)值。
4.根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的特征補(bǔ)償方法,其特征在于用于噪聲參數(shù)估計(jì)和純凈語(yǔ)音估計(jì)的高斯混合模型的協(xié)方差矩陣均取對(duì)角陣。
5.根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的特征補(bǔ)償方法,其特征在于第一 GMM和第二 GMM只對(duì)特征向量的靜態(tài)系數(shù)進(jìn)行建模,不考慮動(dòng)態(tài)系數(shù);基于第一 GMM的噪聲參數(shù)估計(jì)和基于第二 GMM的純凈語(yǔ)音估計(jì)也只計(jì)算噪聲和語(yǔ)音的靜態(tài)系數(shù);純凈語(yǔ)音特征向量的動(dòng)態(tài)系數(shù)通過對(duì)估得的靜態(tài)系數(shù)作時(shí)域差分得到。
全文摘要
本發(fā)明公開一種語(yǔ)音識(shí)別系統(tǒng)中基于快速噪聲估計(jì)的特征補(bǔ)償方法,其主要特點(diǎn)是將特征補(bǔ)償中的噪聲參數(shù)估計(jì)和純凈語(yǔ)音估計(jì)分離開來(lái),噪聲估計(jì)和純凈語(yǔ)音估計(jì)用不同的高斯混合模型實(shí)現(xiàn)。一個(gè)含有較少高斯單元的高斯混合模型GMM用于從含噪測(cè)試語(yǔ)音中提取噪聲參數(shù);另一個(gè)含有較多高斯單元的高斯混合模型GMM用于與估得的單高斯噪聲模型進(jìn)行模型組合,得到與當(dāng)前測(cè)試環(huán)境匹配的含噪GMM;最后用含噪GMM計(jì)算含噪測(cè)試語(yǔ)音的后驗(yàn)概率,用最小均方誤差方法從含噪測(cè)試語(yǔ)音中估計(jì)純凈語(yǔ)音特征向量。本發(fā)明可以在減小計(jì)算量的同時(shí),保證純凈語(yǔ)音估計(jì)的精度。
文檔編號(hào)G10L15/14GK103000174SQ20121048693
公開日2013年3月27日 申請(qǐng)日期2012年11月26日 優(yōu)先權(quán)日2012年11月26日
發(fā)明者呂勇 申請(qǐng)人:河海大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1