日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種麥克風(fēng)語(yǔ)音增強(qiáng)方法及裝置的制造方法

文檔序號(hào):9490335閱讀:453來(lái)源:國(guó)知局
一種麥克風(fēng)語(yǔ)音增強(qiáng)方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語(yǔ)音處理,特別涉及一種麥克風(fēng)語(yǔ)音增強(qiáng)方法及裝置。
【背景技術(shù)】
[0002] 隨著免提通話、會(huì)議系統(tǒng)、智能家居和智能家電的發(fā)展,高質(zhì)量的遠(yuǎn)距離語(yǔ)音拾音 成為影響語(yǔ)音采集處理系統(tǒng)性能的關(guān)鍵因素之一。為了適應(yīng)復(fù)雜的聲音環(huán)境,單麥克風(fēng)技 術(shù)已經(jīng)很難勝任,具有多路語(yǔ)音采集設(shè)備的麥克風(fēng)陣列則日益成為主流,其中最常用的就 是各種波束形成技術(shù)、語(yǔ)音增強(qiáng)技術(shù)等。語(yǔ)音增強(qiáng)技術(shù)需要從語(yǔ)音采集設(shè)備所采集的原始 語(yǔ)音信號(hào)中提取盡可能純凈的目標(biāo)語(yǔ)音。波束形成技術(shù)通過(guò)調(diào)整參數(shù)提高傳聲器陣列對(duì)某 個(gè)方向聲音的靈敏度,提高語(yǔ)音增強(qiáng)的效果。然而現(xiàn)有技術(shù)中大多數(shù)語(yǔ)音增強(qiáng)技術(shù)只能處 理陣元少、間距小的語(yǔ)音采集設(shè)備陣列所采集的原始語(yǔ)音,因此傳統(tǒng)陣列語(yǔ)音增強(qiáng)技術(shù)往 往性能非常有限。

【發(fā)明內(nèi)容】

[0003] 針對(duì)于此,本發(fā)明提供一種麥克風(fēng)語(yǔ)音增強(qiáng)方法及裝置。所述方法及裝置能夠處 理陣元較多、間距較大的語(yǔ)音采集設(shè)備陣列的原始語(yǔ)音。
[0004] 基于上述目的本發(fā)明提供的一種麥克風(fēng)語(yǔ)音增強(qiáng)方法,包括如下步驟:
[0005] 獲取通過(guò)多路數(shù)字語(yǔ)音采集設(shè)備采集輸入的第一陣列語(yǔ)音信號(hào);
[0006] 根據(jù)所述第一陣列語(yǔ)音信號(hào)的最小方差自適應(yīng)波束優(yōu)化模型,采用第一陣列語(yǔ)音 信號(hào)計(jì)算第一陣列語(yǔ)音信號(hào)所合成的最優(yōu)波束輸出信號(hào);
[0007] 采用所述最優(yōu)波束輸出信號(hào)的功率譜估計(jì)值進(jìn)行單通道語(yǔ)音增強(qiáng)處理;
[0008] 所述第一陣列語(yǔ)音信號(hào)的最小方差自適應(yīng)波束優(yōu)化模型包括目標(biāo)聲源到所述多 路數(shù)字語(yǔ)音采集設(shè)備的空間導(dǎo)向矢量。
[0009] 可選的,獲取通過(guò)多路數(shù)字語(yǔ)音采集設(shè)備采集輸入的第一陣列語(yǔ)音信號(hào)之前,還 包括:
[0010] 通過(guò)多路數(shù)字語(yǔ)音采集設(shè)備采集原始語(yǔ)音陣列信號(hào)7: (η),……yN(n);
[0011] 對(duì)所述原始語(yǔ)音信號(hào)進(jìn)行短時(shí)傅里葉變換得到所述原始語(yǔ)音陣列信號(hào)的時(shí)頻表 示信號(hào)yi(k,λ)......yN(k,λ);
[0012] 采用最優(yōu)超指向波束系數(shù)AGO= [ai(k),......,%(10^對(duì)所述時(shí)頻表示信號(hào)進(jìn) 行頻域最優(yōu)超指向波束處理,得到第一陣列語(yǔ)音信號(hào)Lavihi= 1……N;
[0013] 所述η為離散時(shí)間變量;N為陣元個(gè)數(shù);k為頻點(diǎn)編號(hào);λ為短時(shí)幀編號(hào)。
[0014] 可選的,所述最優(yōu)超指向波束系數(shù)根據(jù)所述多路數(shù)字語(yǔ)音采集設(shè)備的設(shè)置方式進(jìn) 行設(shè)定。
[0015] 可選的,根據(jù)所述第一陣列語(yǔ)音信號(hào)的最小方差自適應(yīng)波束優(yōu)化模型,采用第一 陣列語(yǔ)音信號(hào)計(jì)算第一陣列語(yǔ)音信號(hào)所合成的最優(yōu)波束輸出信號(hào)時(shí),采用下述公式:
[0017] 為所述最優(yōu)波束輸出信號(hào);wj為根據(jù)噪聲信號(hào)列矢量和最優(yōu)超指向波束 系數(shù)和目標(biāo)聲源到各個(gè)數(shù)字語(yǔ)音采集設(shè)備的空間導(dǎo)向矢量計(jì)算的自適應(yīng)濾波器參數(shù);.< 為最優(yōu)超指向波束系數(shù)A(k) = [ai(k),......,aN(k)]T中陣元%的共軛復(fù)數(shù);yi(k,λ)為 所述第一陣列語(yǔ)音信號(hào)。
[0018] 可選的,所述第一陣列語(yǔ)音信號(hào)的最小方差自適應(yīng)波束優(yōu)化模型為:
[0020] 其中,w(k)中的陣元與g互為共軛復(fù)數(shù);wH(k)為w(k)的共軛轉(zhuǎn)制矩陣;R、4)為 根據(jù)所述第一陣列語(yǔ)音信號(hào)估計(jì)的噪聲相干矩陣;土幻為目標(biāo)聲源到所述數(shù)字語(yǔ)音采集 設(shè)備的空間導(dǎo)向矢量。
[0021] 可選的,所述目標(biāo)聲源到數(shù)字語(yǔ)音采集設(shè)備的空間導(dǎo)向矢量根據(jù)下述公式計(jì)算:
[0023] 其中,山……dN是第1到N個(gè)數(shù)字語(yǔ)音采集設(shè)備到數(shù)字語(yǔ)音采集設(shè)備陣列中心的 距離,c是聲速;fs是采樣頻率;Θ為目標(biāo)聲源到數(shù)字語(yǔ)音采集設(shè)備的方位角;g為最優(yōu)超 指向波束系數(shù)A(k) = [ai(k),......,aN(k)]T中陣元的共軛復(fù)數(shù)。
[0024] 可選的,所述方法還包括:
[0025] 對(duì)所述多個(gè)通道的陣列語(yǔ)音輸入信號(hào)中的噪聲信號(hào)陣列進(jìn)行語(yǔ)音活動(dòng)檢測(cè)VAD;
[0026] 根據(jù)所述語(yǔ)音活動(dòng)檢測(cè)VAD的結(jié)果對(duì)噪聲信號(hào)陣列進(jìn)行噪聲功率譜估計(jì);
[0027] 根據(jù)所述最優(yōu)波束輸出信號(hào)的最優(yōu)功率譜估計(jì)值和所述噪聲功率譜估計(jì)值對(duì)所 述最優(yōu)波束輸出信號(hào)進(jìn)行第二次增強(qiáng)。
[0028] 可選的,根據(jù)所述語(yǔ)音活動(dòng)檢測(cè)VAD的結(jié)果對(duì)噪聲信號(hào)陣列進(jìn)行噪聲功率譜估計(jì) 的步驟包括:
[0029] 計(jì)算有語(yǔ)音狀態(tài)、無(wú)語(yǔ)音狀態(tài)、語(yǔ)音開(kāi)始狀態(tài)、語(yǔ)音結(jié)束狀態(tài)時(shí)的噪聲功率譜;
[0030] 對(duì)所述有語(yǔ)音狀態(tài)時(shí)的噪聲功率譜和無(wú)語(yǔ)音狀態(tài)時(shí)的噪聲功率譜進(jìn)行折中處理, 得到噪聲功率譜估計(jì)值。
[0031] 可選的,計(jì)算有語(yǔ)音狀態(tài)、無(wú)語(yǔ)音狀態(tài)、語(yǔ)音開(kāi)始狀態(tài)、語(yǔ)音結(jié)束狀態(tài)時(shí)的噪聲功 率譜的步驟具體包括:
[0032] 當(dāng)處于無(wú)語(yǔ)音狀態(tài)時(shí),采用下述公式對(duì)噪聲信號(hào)陣列功率譜估計(jì):
[0034] 當(dāng)處于語(yǔ)音開(kāi)始狀態(tài)和有語(yǔ)音狀態(tài)時(shí),采用下述公式對(duì)噪聲信號(hào)陣列功率譜進(jìn)行 估計(jì):
[0036] 處于語(yǔ)音結(jié)束狀態(tài)時(shí),采用下述公式對(duì)噪聲信號(hào)陣列功率譜進(jìn)行雙極點(diǎn)回歸平滑 估計(jì):
[0041] 其中,%為噪聲譜更新參數(shù);aa、ad分別為平滑系數(shù)。
[0042] 可選的,所述最優(yōu)波束輸出信號(hào)的功率譜估計(jì)值采用下述公式進(jìn)行計(jì)算:
[0044] 其中,失·(?>為所述最優(yōu)波束輸出信號(hào)的功率譜估計(jì)值;&&1>為所述最優(yōu)波束 輸出信號(hào);a。為噪聲譜更新參數(shù)。
[0045] 進(jìn)一步,本發(fā)明提供一種麥克風(fēng)語(yǔ)音增強(qiáng)裝置,包括:
[0046] 第一獲取模塊:用于獲取通過(guò)多路數(shù)字語(yǔ)音采集設(shè)備采集輸入的第一陣列語(yǔ)音信 號(hào);
[0047] 最優(yōu)波束輸出信號(hào)計(jì)算模塊:用于根據(jù)所述第一陣列語(yǔ)音信號(hào)的最小方差自適 應(yīng)波束優(yōu)化模型,采用第一陣列語(yǔ)音信號(hào)計(jì)算第一陣列語(yǔ)音信號(hào)所合成的最優(yōu)波束輸出信 號(hào);
[0048] 第一增強(qiáng)模塊:用于采用所述最優(yōu)波束輸出信號(hào)的功率譜估計(jì)值進(jìn)行單通道語(yǔ)音 增強(qiáng)處理;
[0049] 所述第一陣列語(yǔ)音信號(hào)的最小方差自適應(yīng)波束優(yōu)化模型包括目標(biāo)聲源到所述多 路數(shù)字語(yǔ)音采集設(shè)備的空間導(dǎo)向矢量。
[0050] 可選的,所述裝置還包括:
[0051] 原始信號(hào)采集模塊:用于通過(guò)多路數(shù)字語(yǔ)音采集設(shè)備采集原始語(yǔ)音陣列信號(hào) Υι(η), ......yN(n);
[0052] 原始信號(hào)變換模塊:用于對(duì)所述原始語(yǔ)音信號(hào)進(jìn)行短時(shí)傅里葉變換得到所述原始 語(yǔ)音陣列信號(hào)的時(shí)頻表示信號(hào)又:㈦λ)……yN(k,λ);
[0053] 最優(yōu)超指向波束處理模塊:用于采用最優(yōu)超指向波束系數(shù)A(k)=
[ai(k),......,aN (k) ]τ對(duì)所述時(shí)頻表示信號(hào)進(jìn)行頻域最優(yōu)超指向波束處理,得到第一陣列 語(yǔ)首?目號(hào)義(Α%幻'i= 1......N;
[0054] 所述η為離散時(shí)間變量;N為陣元個(gè)數(shù);k為頻點(diǎn)編號(hào);λ為短時(shí)帖編號(hào)。
[0055] 可選的,所述最優(yōu)超指向波束系數(shù)根據(jù)所述多路數(shù)字語(yǔ)音采集設(shè)備的設(shè)置方式進(jìn) 行設(shè)定。
[0056] 可選的,所述最優(yōu)波束輸出信號(hào)計(jì)算模塊根據(jù)所述第一陣列語(yǔ)音信號(hào)的最小方差 自適應(yīng)波束優(yōu)化模型,采用第一陣列語(yǔ)音信號(hào)計(jì)算第一陣列語(yǔ)音信號(hào)所合成的最優(yōu)波束輸 出信號(hào)時(shí),采用下述公式:
[0058] 只Α%句為所述最優(yōu)波束輸出信號(hào);g為根據(jù)噪聲信號(hào)列矢量和最優(yōu)超指向波束 系數(shù)和目標(biāo)聲源到各個(gè)數(shù)字語(yǔ)音采集設(shè)備的空間導(dǎo)向矢量計(jì)算的自適應(yīng)濾波器參數(shù);< 為最優(yōu)超指向波束系數(shù)A(k)=[ai(k),......,aN(k)]T中陣元%的共軛復(fù)數(shù);yi(k,λ)為 所述第一陣列語(yǔ)音信號(hào)。
[0059] 可選的,第一陣列語(yǔ)音信號(hào)的最小方差自適應(yīng)波束優(yōu)化模型為:
[0061] 其中,w(k)中的陣元與g互為共軛復(fù)數(shù);wH(k)為w(k)的共軛轉(zhuǎn)制矩陣後)為 根據(jù)所述第一陣列語(yǔ)音信號(hào)估計(jì)的噪聲相干矩陣;^參)為目標(biāo)聲源到所述數(shù)字語(yǔ)音采集設(shè) 備的空間導(dǎo)向矢量。
[0062] 可選的,最優(yōu)波束輸出信號(hào)計(jì)算模塊計(jì)算第一陣列語(yǔ)音信號(hào)所和成的最優(yōu)波束輸 出信號(hào)時(shí),所采用的目標(biāo)聲源到數(shù)字語(yǔ)音采集設(shè)備的空間導(dǎo)向矢量根據(jù)下述公式計(jì)算:
[0064] 其中,山……dN是第1到N個(gè)數(shù)字語(yǔ)音采集設(shè)備到數(shù)字語(yǔ)音采集設(shè)備陣列中心的 距離,c是聲速;fs是采樣頻率;Θ為目標(biāo)聲源到數(shù)字語(yǔ)音采集設(shè)備的方位角; < 為最優(yōu)超 指向波束系數(shù)A(k) = [ai(k),......,aN(k)]T中陣元的共軛復(fù)數(shù)。
[0065] 可選的,還包括:
[0066] VAD模塊:用于對(duì)所述多個(gè)通道的陣列語(yǔ)音輸入信號(hào)中的噪聲信號(hào)陣列進(jìn)行語(yǔ)音 活動(dòng)檢測(cè)VAD;
[0067] 噪聲功率譜估計(jì)模塊:用于根據(jù)所述語(yǔ)音活動(dòng)檢測(cè)VAD的結(jié)果對(duì)噪聲信號(hào)陣列進(jìn) 行噪聲功率譜估計(jì);
[0068] 第二增強(qiáng)模塊:用于根據(jù)所述最優(yōu)波束輸出信號(hào)的最優(yōu)功率譜估計(jì)值和所述噪聲 功率譜估計(jì)值對(duì)所述最優(yōu)波束輸出信號(hào)進(jìn)行第二次增強(qiáng)。
[0069] 可選的,所述噪聲功率譜估計(jì)模塊包括:
[0070] 第一噪聲功率譜計(jì)算單元:用于計(jì)算有語(yǔ)音狀態(tài)、無(wú)語(yǔ)音狀態(tài)、語(yǔ)音開(kāi)始狀態(tài)、語(yǔ) 音結(jié)束狀態(tài)時(shí)的噪聲功率譜;
[0071] 第二噪聲功率譜計(jì)算單元:用于對(duì)所述有語(yǔ)音狀態(tài)時(shí)的噪聲功率譜和無(wú)語(yǔ)音狀態(tài) 時(shí)的噪聲功率譜進(jìn)行折中處理,得到噪聲
當(dāng)前第1頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1