自適應(yīng)環(huán)境聲抑制和語(yǔ)音跟蹤的制作方法

文檔序號(hào)：7575857閱讀：202來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：自適應(yīng)環(huán)境聲抑制和語(yǔ)音跟蹤的制作方法
自適應(yīng)環(huán)境聲抑制和語(yǔ)音跟蹤
背景技術(shù)：
各種計(jì)算設(shè)備，包括但不局限于互動(dòng)娛樂(lè)設(shè)備例如視頻游戲系統(tǒng)，可被配置為接受語(yǔ)音輸入以允許用戶通過(guò)語(yǔ)音命令控制系統(tǒng)操作。這些計(jì)算設(shè)備包括一個(gè)或多個(gè)麥克風(fēng) 以允許該計(jì)算設(shè)備在使用期間捕獲用戶語(yǔ)音。然而，要將用戶語(yǔ)音從環(huán)境噪聲，例如來(lái)自揚(yáng) 聲器輸出、使用環(huán)境中其他人員、固定源例如計(jì)算設(shè)備風(fēng)扇的噪聲中區(qū)分開(kāi)來(lái)是困難的。而且，在使用期間，用戶的物理移動(dòng)也會(huì)增加這些困難。一些解決這樣的問(wèn)題的當(dāng)前方案包括指令用戶不要在使用環(huán)境中改變位置，或執(zhí) 行一個(gè)動(dòng)作以警告計(jì)算設(shè)備將要到來(lái)的輸入。然而，這些方案可能會(huì)對(duì)語(yǔ)音輸入環(huán)境的使用所期望的自發(fā)性和易用性產(chǎn)生負(fù)面影響。

發(fā)明內(nèi)容
因此，在此揭示了各種涉及抑制麥克風(fēng)陣列所接收的語(yǔ)音中環(huán)境聲的實(shí)施例。例如，一個(gè)實(shí)施例提供了一種包括麥克風(fēng)陣列、處理器、模數(shù)轉(zhuǎn)換器和存儲(chǔ)器的設(shè)備，所述存儲(chǔ)器包括存儲(chǔ)在其上由處理器執(zhí)行以抑制麥克風(fēng)陣列所接收的語(yǔ)音輸入中環(huán)境聲的指令。例如，指令可執(zhí)行以從模數(shù)轉(zhuǎn)換器接收多個(gè)數(shù)字聲音信號(hào)，每個(gè)數(shù)字聲音信號(hào)基于源自麥克風(fēng)指令的模擬聲音信號(hào)，并且還能接收多聲道揚(yáng)聲器信號(hào)。所述指令還可執(zhí)行以生成每個(gè)多聲道揚(yáng)聲器信號(hào)的單聲道近似信號(hào)(approximation signal)，并將線性回音消除器應(yīng) 用于每個(gè)使用所述近似信號(hào)的數(shù)字聲音信號(hào)。所述指令還可執(zhí)行以通過(guò)時(shí)間恒定和自適應(yīng) 波束生成技術(shù)的組合從多個(gè)數(shù)字聲音信號(hào)的組合中生成已組合定向自適應(yīng)聲音信號(hào)，并應(yīng) 用一個(gè)或多個(gè)非線性噪聲抑制技術(shù)來(lái)抑制已組合定向自適應(yīng)聲音信號(hào)的第二環(huán)境聲部分。提供本概述是為了以簡(jiǎn)化的形式介紹將在以下詳細(xì)描述中進(jìn)一步描述的一些概念。本發(fā)明內(nèi)容并不旨在標(biāo)識(shí)出所要求保護(hù)的主題的關(guān)鍵特征或必要特征，也不旨在用于限定所要求保護(hù)的主題的范圍。此外，所要求保護(hù)的主題不限于解決在本發(fā)明的任一部分中提及的任何或所有缺點(diǎn)的實(shí)現(xiàn)。

圖1是音頻輸入設(shè)備的實(shí)施例的操作環(huán)境的實(shí)施例的示意圖。圖2是音頻輸入設(shè)備的實(shí)施例的示意圖。圖3A是操作圖2的音頻輸入設(shè)備的方法實(shí)施例的流程圖。圖;3B是圖3A的流程圖的延續(xù)。
具體實(shí)施例方式圖1是音頻輸入設(shè)備102的實(shí)施例的操作環(huán)境100的實(shí)施例的示意圖，所述音頻輸入設(shè)備102用于為通過(guò)音頻輸入設(shè)備102的麥克風(fēng)陣列(圖1中框150所示)從語(yǔ)音源 S接收的語(yǔ)音輸入抑制環(huán)境聲。例如，操作環(huán)境100可以表示家庭影院環(huán)境、視頻游戲游玩空間等。應(yīng)該理解地是操作環(huán)境100是一示例操作環(huán)境；單純出于說(shuō)明的目的，描述了操作環(huán)境的不同要素的尺寸、配置和安排。其他合適的操作環(huán)境也可與音頻輸入設(shè)備102—起使用。除了音頻輸入設(shè)備102之外，操作環(huán)境100可包括遠(yuǎn)程計(jì)算設(shè)備104。在一些實(shí)施例中，遠(yuǎn)程計(jì)算設(shè)備可以包括游戲控制臺(tái)，而在其他實(shí)施例中，所述遠(yuǎn)程計(jì)算設(shè)備包括任意其他合適的計(jì)算設(shè)備。例如，在一個(gè)場(chǎng)景中，遠(yuǎn)程計(jì)算設(shè)備104可以是在網(wǎng)絡(luò)環(huán)境中工作的遠(yuǎn)程服務(wù)器、移動(dòng)設(shè)備例如移動(dòng)電話、膝上型電腦或其他個(gè)人計(jì)算設(shè)備等。遠(yuǎn)程計(jì)算設(shè)備104通過(guò)一個(gè)或多個(gè)連接112被連接到音頻輸入設(shè)備102。應(yīng)該理解圖1中所示的各種連接在一些實(shí)施例中可以是合適的物理連接或在另一些實(shí)施例中可以是合適的無(wú)線連接，或它們合適的組合。而且，操作環(huán)境100可以包括通過(guò)合適的顯示連接Iio連接到遠(yuǎn)程計(jì)算設(shè)備104的顯示器106。操作環(huán)境100還包括一個(gè)或多個(gè)通過(guò)合適的揚(yáng)聲器連接114連接到遠(yuǎn)程計(jì)算設(shè)備 104的一個(gè)或多個(gè)揚(yáng)聲器108，通過(guò)該一個(gè)或多個(gè)揚(yáng)聲器可以傳送揚(yáng)聲器信號(hào)。在一些實(shí)施例中，揚(yáng)聲器108可被配置為提供多聲道聲音。例如，操作環(huán)境100可被配置為5. 1聲道的環(huán)繞聲聲音，并可包括左聲道揚(yáng)聲器、右聲道揚(yáng)聲器、中聲道揚(yáng)聲器、低頻率效應(yīng)揚(yáng)聲器、左聲道環(huán)繞揚(yáng)聲器和右聲道環(huán)繞揚(yáng)聲器(這些揚(yáng)聲器的每個(gè)都被參考數(shù)字108標(biāo)識(shí))。這樣，在示例實(shí)施例中，在所述5. 1聲道環(huán)繞聲揚(yáng)聲器信號(hào)中可以傳送6個(gè)音頻聲道。圖2是音頻輸入設(shè)備102的實(shí)施例的示意圖。音頻輸入設(shè)備102包括麥克風(fēng)陣列，所述麥克風(fēng)陣列包括多個(gè)用于將聲音，例如語(yǔ)音輸入，轉(zhuǎn)換成模擬聲音信號(hào)206以在音頻輸入設(shè)備102中處理的麥克風(fēng)205。來(lái)自麥克風(fēng)的模擬聲音信號(hào)被定向到模數(shù)轉(zhuǎn)換器 (ADC) 207，在其中，每個(gè)模擬聲音信號(hào)被轉(zhuǎn)換成數(shù)字聲音信號(hào)。音頻輸入設(shè)備102還被配置為從時(shí)鐘信號(hào)源250接收時(shí)鐘信號(hào)252，將在下面內(nèi)容中詳細(xì)描述其示例。時(shí)鐘信號(hào)252可被用于同步在模數(shù)轉(zhuǎn)換器207處要被轉(zhuǎn)換為多個(gè)數(shù)字聲音信號(hào)208的模擬聲音信號(hào)206。例如，在一些實(shí)施例中，時(shí)鐘信號(hào)252可以是與麥克風(fēng)輸入時(shí)鐘同步的揚(yáng)聲器輸出時(shí)鐘信號(hào)。音頻輸入設(shè)備102進(jìn)一步包括大容量存儲(chǔ)器212、處理器214、存儲(chǔ)器216以及噪聲抑制器217的實(shí)施例，該實(shí)施例可存儲(chǔ)在海量存儲(chǔ)器212中并被加載到存儲(chǔ)器216以供處理器214執(zhí)行。如下將詳細(xì)描述，噪聲抑制器217在三個(gè)階段中應(yīng)用噪聲抑制技術(shù)。在第一階段，噪聲抑制器217被配置為用一個(gè)或多個(gè)線性噪聲抑制技術(shù)來(lái)抑制每個(gè)數(shù)字聲音信號(hào)208中的環(huán)境聲部分。這些線性噪聲抑制技術(shù)可配置為抑制來(lái)自固定源的環(huán)境聲，和/或展現(xiàn)些許動(dòng)態(tài)活動(dòng)的其他環(huán)境聲。例如，噪聲抑制器217的第一線性抑制階段可以抑制來(lái)自固定源如游戲控制臺(tái)的冷卻風(fēng)扇的電機(jī)噪聲，并可抑制來(lái)自固定揚(yáng)聲器的揚(yáng)聲器噪聲。這樣，音頻輸入設(shè)備102可以被配置為接收來(lái)自揚(yáng)聲器信號(hào)源219的多聲道揚(yáng)聲器信號(hào)218(例如遠(yuǎn)程計(jì)算設(shè)備104的揚(yáng)聲器信號(hào)輸出)以幫助這種噪聲的抑制。在第二階段中，將噪聲抑制器217配置為從含有有關(guān)所接收的信號(hào)源自哪個(gè)方向的信息的每個(gè)數(shù)字聲音信號(hào)208，將多個(gè)數(shù)字聲音信號(hào)組合成單獨(dú)的已組合定向自適應(yīng)聲音信號(hào)210。在第三階段中，將噪聲抑制器217配置為用一個(gè)或多個(gè)非線性噪聲抑制技術(shù)來(lái)抑制已組合定向自適應(yīng)聲音信號(hào)210中的環(huán)境聲，所述非線性噪聲抑制技術(shù)對(duì)源自離所接收的語(yǔ)音源自的那個(gè)方向更遠(yuǎn)的噪聲應(yīng)用比源自離該方向更近的噪聲更加大量的噪聲抑制。這些非線性噪聲抑制技術(shù)可配置為，例如，抑制展現(xiàn)更多動(dòng)態(tài)活動(dòng)的環(huán)境噪聲。在執(zhí)行噪聲抑制之后，將音頻輸入設(shè)備102配置為輸出所得到的聲音信號(hào)206，該所得到的聲音信號(hào)206可隨后被用于標(biāo)識(shí)所接收語(yǔ)音信號(hào)中的語(yǔ)音輸入。在一些實(shí)施例中，所得到的聲音信號(hào)206可被用于語(yǔ)音識(shí)別。而圖2示出提供給遠(yuǎn)程計(jì)算設(shè)備104的輸出，可以理解所述輸出可以提供給本地語(yǔ)音識(shí)別系統(tǒng)或任意其他合適位置處的語(yǔ)音識(shí)別系統(tǒng)。另外或可選地，在一些實(shí)施例中，所得到的聲音信號(hào)260可用于無(wú)線電通訊應(yīng)用中。在執(zhí)行非線性技術(shù)之前執(zhí)行線性噪聲抑制技術(shù)可以提供各種優(yōu)點(diǎn)。例如，執(zhí)行線性噪聲減少以從固定和/或期望源(例如風(fēng)扇、揚(yáng)聲器聲音等)移除噪聲可以在相對(duì)較低的抑制期望語(yǔ)音輸入的可能性下執(zhí)行，并且還可以顯著減少所述數(shù)字聲音信號(hào)的動(dòng)態(tài)范圍，以允許減少所述數(shù)字音頻信號(hào)的位深度，以提供更加有效的下游處理。這樣的位深度減少將在下面進(jìn)一步詳述。在一些實(shí)施例中，線性噪聲抑制技術(shù)的應(yīng)用在噪聲抑制處理開(kāi)始不久后發(fā)生。申請(qǐng)人意識(shí)到這種方式可以減少下游非線性抑制信號(hào)處理量，這將加速下游信號(hào)處理。麥克風(fēng)陣列202可以具有任意合適的配置。例如，在一些實(shí)施例中，麥克風(fēng)205可以沿一公共軸安置。在這樣的安置中，麥克風(fēng)205可以在麥克風(fēng)陣列202中彼此均勻間隔，或在麥克風(fēng)陣列202中彼此不均勻間隔。使用不均勻間隔有助于避免由于破壞性干擾在所有麥克風(fēng)205處在單個(gè)頻率中出現(xiàn)的頻率零值。在一特定實(shí)施例中，麥克風(fēng)陣列202可根據(jù)表1中的尺寸集進(jìn)行配置?？梢岳斫?，也可使用其他合適的安排。表1
長(zhǎng)度 (m)在麥克風(fēng)和陣列的中心線“Y”之司的距離整體205A-Y205B - Y205C-Y205D — Y0.225-0.11250.03050.07550.1125模數(shù)轉(zhuǎn)換器207可配置為將由每個(gè)麥克風(fēng)205所生成的每個(gè)模擬聲音信號(hào)206轉(zhuǎn) 換為對(duì)應(yīng)的數(shù)字聲音信號(hào)208，其中源自每個(gè)麥克風(fēng)205的每個(gè)數(shù)字聲音信號(hào)208具有第一較高位深度。例如，模數(shù)轉(zhuǎn)換器207可以是M位模數(shù)轉(zhuǎn)換器以支持展示大動(dòng)態(tài)范圍的聲音環(huán)境。這樣的位深度的使用相對(duì)于較低位深度的使用而言有助于減少每個(gè)模擬聲音信號(hào) 206的數(shù)字限幅。而且，如下將詳細(xì)描述，所述模數(shù)轉(zhuǎn)換器所輸出的M位數(shù)字聲音信號(hào)可以在噪聲抑制處理中的中間階段被轉(zhuǎn)換成較低位深度以幫助提高下游處理效率。在一特定實(shí) 施例中，模數(shù)轉(zhuǎn)換器207所輸出的每個(gè)數(shù)字聲音信號(hào)208是單聲道、16kHz、24位的數(shù)字聲音信號(hào)。在一些實(shí)施例中，將模數(shù)轉(zhuǎn)換器207配置為通過(guò)從遠(yuǎn)程計(jì)算設(shè)備104接收的時(shí)鐘信號(hào)252將每個(gè)數(shù)字聲音信號(hào)208與揚(yáng)聲器信號(hào)218同步。例如，由遠(yuǎn)程計(jì)算設(shè)備104的時(shí) 鐘信號(hào)源250生成的USB起始幀分組信號(hào)可用于同步模數(shù)轉(zhuǎn)換器207以將每個(gè)麥克風(fēng)205 處接收的聲音與揚(yáng)聲器信號(hào)218同步。將揚(yáng)聲器信號(hào)218配置為包括用于在揚(yáng)聲器108處生成揚(yáng)聲器聲音的數(shù)字揚(yáng)聲器聲音信號(hào)。揚(yáng)聲器信號(hào)218與數(shù)字聲音信號(hào)208的同步可以為在每個(gè)麥克風(fēng)205接收的一部分揚(yáng)聲器聲音的后續(xù)噪聲抑制提供時(shí)間參考。模數(shù)轉(zhuǎn)換器207的輸出在第一階段噪聲抑制器217處被接收，在其中，噪聲抑制器移除第一部分的環(huán)境噪聲。在所描述的實(shí)施例中，每個(gè)數(shù)字聲音信號(hào)208通過(guò)時(shí)-頻域變換(TFD)模塊220處的變換被轉(zhuǎn)換成頻域。例如，可使用變換算法，例如傅利葉變換、調(diào)制復(fù)重疊變換、快速傅利葉變換或任意其他合適的變換算法，來(lái)將每個(gè)數(shù)字聲音信號(hào)208轉(zhuǎn) 換為頻域。在模塊220處被轉(zhuǎn)換成頻域的數(shù)字聲音信號(hào)208被輸出到多聲道回音消除器 (MEC) 224。將多聲道回音消除器2M配置為從揚(yáng)聲器信號(hào)源219接收多聲道揚(yáng)聲器信號(hào) 218。在一些實(shí)施例中，揚(yáng)聲器信號(hào)218還被傳送給快速傅利葉變換模塊220以將揚(yáng)聲器信號(hào)218變換為具有頻域的揚(yáng)聲器信號(hào)，并隨后輸出給多聲道回音消除器224。每個(gè)多聲道回音消除器2 包括多聲道-單聲道(MTM)變換模塊225和線性音頻回音消除器(AEC) 226。將每個(gè)單聲道變換模塊225配置為生成多聲道揚(yáng)聲器信號(hào)218的單聲道近似信號(hào)222，該單聲道近似信號(hào)222近似由對(duì)應(yīng)的麥克風(fēng)205所接收的揚(yáng)聲器聲音可使用預(yù)定校準(zhǔn)信號(hào)(CS) 270來(lái)幫助生成所述單聲道近似。例如，可通過(guò)從揚(yáng)聲器發(fā)射已知校準(zhǔn)音頻信號(hào)(CAQ 272、通過(guò)麥克風(fēng)陣列接收源自校準(zhǔn)音頻信號(hào)的揚(yáng)聲器輸出，并隨后將所接收的信號(hào)輸出和揚(yáng)聲器所接收的信號(hào)進(jìn)行比較，來(lái)確定校準(zhǔn)信號(hào)270。校準(zhǔn)信號(hào)可以間歇地被確定，例如，在系統(tǒng)建立或啟動(dòng)時(shí)，或者也可以更加頻繁地被執(zhí)行。在一些實(shí)施例中，校準(zhǔn)音頻信號(hào)272可以配置為與揚(yáng)聲器之間無(wú)關(guān)且覆蓋預(yù)定頻譜的任意合適的音頻信號(hào)。例如，在一些實(shí)施例中，可使用掃描正弦信號(hào)。在一些其他實(shí)施例中，可以使用樂(lè)音信號(hào)。從對(duì)應(yīng)的多聲道-單聲道變換模塊225將每個(gè)單聲道近似信號(hào)222傳送給對(duì)應(yīng)的線性音頻回音消除器226。將每個(gè)線性音頻回音消除器2 配置為至少部分基于單聲道近似信號(hào)222來(lái)抑制每個(gè)數(shù)字聲音信號(hào)208的第一環(huán)境聲部分。例如，在一個(gè)場(chǎng)景中，每個(gè)線性音頻回音消除器2 可以被配置為將數(shù)字聲音信號(hào)208與單聲道近似信號(hào)222進(jìn)行比較，并進(jìn)一步被配置為從對(duì)應(yīng)的數(shù)字聲音信號(hào)208中減去單聲道近似信號(hào)222。如上所述，在一些實(shí)施例中，在將線性音頻回音消除器2 應(yīng)用到位深度減少 (BR)模塊227處的每個(gè)數(shù)字聲音信號(hào)208之后，每個(gè)多聲道回音消除器2M可配置為將每個(gè)數(shù)字聲音信號(hào)208轉(zhuǎn)換為具有第二較低位深度的數(shù)字聲音信號(hào)208。例如，在一些實(shí)施例中，可以從數(shù)字聲音信號(hào)208中移除至少一部分多聲道揚(yáng)聲器信號(hào)218，以導(dǎo)致生成位深度減少的聲音信號(hào)。這種位深度減少有助于通過(guò)允許位深度減少的聲音信號(hào)的動(dòng)態(tài)范圍占據(jù) 較少位深度來(lái)加速下游計(jì)算處理。位深度可以在任意合適的處理點(diǎn)處被減少，并可減少任意合適的程度。例如，在所描述的實(shí)施例中，在應(yīng)用線性音頻回音消除器2 之后，M位數(shù) 字聲音信號(hào)可以被轉(zhuǎn)換為16位數(shù)字聲音信號(hào)。在其他實(shí)施例中，位深度可以被減少另一數(shù) 量和/或在另一合適的點(diǎn)被減少。而且，在一些實(shí)施例中，丟棄的位可對(duì)應(yīng)于數(shù)字聲音信號(hào) 208先前所包含的部分，該部分對(duì)應(yīng)于在線性音頻回音消除器2 處所抑制的揚(yáng)聲器聲音。繼續(xù)圖2，所描述的噪聲抑制器217還被配置為將線性固定音移除器(STR) 2 應(yīng) 用到每個(gè)數(shù)字聲音信號(hào)208。將線性固定音移除器2 配置為移除由近似的恒定音處的源所發(fā)射的背景聲音。例如，風(fēng)扇、空調(diào)或其他白色噪聲源能夠發(fā)射可被麥克風(fēng)陣列202接收的近似恒定音。在一場(chǎng)景中，線性固定音移除器2 可以被配置為創(chuàng)建在數(shù)字聲音信號(hào)208 中檢測(cè)到的近似恒定音的模型并應(yīng)用噪聲消除技術(shù)以移除該音。？在一些實(shí)施例中，在應(yīng) 用每個(gè)線性音頻回音消除器2 之后且在生成已組合定向自適應(yīng)聲音信號(hào)210之前可以將每個(gè)線性固定音移除器2 應(yīng)用到每個(gè)數(shù)字聲音信號(hào)208。在一些其他實(shí)施例中，所述線性
8固定音移除器可以在噪聲抑制器217中具有任意其他適合的位置。在如上所述應(yīng)用了這樣的線性噪聲抑制處理之后，將所述多個(gè)數(shù)字聲音信號(hào)提供給噪聲抑制器217的第二階段，該階段包括波束生成器230。將波束生成器230配置為接收每個(gè)線性固定音移除器228的輸出并從所述多個(gè)數(shù)字聲音信號(hào)的組合中生成已組合定向自適應(yīng)聲音信號(hào)210。波束生成器230通過(guò)利用陣列中四個(gè)麥克風(fēng)的每個(gè)麥克風(fēng)處接收聲音的時(shí)間之間的差值來(lái)確定聲音是從哪個(gè)方向被接收的，以形成定向自適應(yīng)聲音信號(hào)210。可以以任何合適的方式來(lái)確定已組合定向自適應(yīng)聲音信號(hào)。例如，在描述的實(shí)施例中，基于時(shí)間恒定和自適應(yīng)波形技術(shù)的組合來(lái)確定定向自適應(yīng)聲音信號(hào)。所得到的已組合信號(hào)可以具有窄方向性模式，該模式在語(yǔ)音源方向上前進(jìn)。波束生成器230可包括時(shí)間恒定波束生成器232和自適應(yīng)波束生成器236以生成已組合定向自適應(yīng)聲音信號(hào)210。將時(shí)間恒定波束生成器232配置為將一系列預(yù)定加權(quán)系數(shù)234應(yīng)用到每個(gè)數(shù)字聲音信號(hào)208，至少部分基于在麥克風(fēng)陣列202的預(yù)定聲音接收區(qū)域中的各向同性的環(huán)境噪聲分布來(lái)計(jì)算每個(gè)預(yù)定加權(quán)系數(shù)234。在一些實(shí)施例中，時(shí)間恒定波束生成器232可以被配置為執(zhí)行每個(gè)數(shù)字聲音信號(hào) 208的線性組合?？梢杂煽纱鎯?chǔ)在查找表中的一個(gè)或多個(gè)預(yù)定加權(quán)系統(tǒng)234對(duì)每個(gè)數(shù)字聲音信號(hào)208進(jìn)行加權(quán)?？梢蕴崆盀辂溈孙L(fēng)陣列202的預(yù)定聲音接收區(qū)域計(jì)算預(yù)定加權(quán)系統(tǒng) 234。例如，可以在麥克風(fēng)陣列202的中心線任一側(cè)上延伸50度的聲音接收區(qū)域中以10度間隔來(lái)計(jì)算預(yù)定加權(quán)系統(tǒng)234。時(shí)間恒定波束生成器232和與自適應(yīng)波束生成器236協(xié)作。例如，預(yù)定加權(quán)系統(tǒng) 234可以幫助自適應(yīng)波束生成器236的操作。在一場(chǎng)景中，時(shí)間恒定波束生成器232可為自適應(yīng)波束生成器236的操作提供起始點(diǎn)。在第二場(chǎng)景中，自適應(yīng)波束生成器236以預(yù)定間隔參考時(shí)間恒定波束生成器232。這對(duì)于減少集中在語(yǔ)音源S的一位置上的計(jì)算周期的數(shù)目有潛在益處。將自適應(yīng)波束生成器236配置為應(yīng)用聲音源定位器238以確定相對(duì)于麥克風(fēng) 陣列202的語(yǔ)音源S的接收角θ (參見(jiàn)圖1)，并當(dāng)語(yǔ)音源S實(shí)時(shí)移動(dòng)時(shí)至少部分基于接收角θ跟蹤語(yǔ)音源S。接收角θ作為接收角消息237被傳送給自適應(yīng)波束生成器236。波束生成器230輸出已組合定向自適應(yīng)聲音信號(hào)210以用于進(jìn)一步的下游噪聲抑制。例如，已組合定向自適應(yīng)聲音信號(hào)210可包括數(shù)字聲音信號(hào)，該數(shù)字聲音信號(hào)在源自語(yǔ)音源S的方向上具有較高強(qiáng)度的主波瓣，并且基于預(yù)定的加權(quán)系數(shù)234和接收角θ具有一個(gè)或多個(gè) 較低強(qiáng)度的副波瓣。在一些實(shí)施例中，聲音源定位器238可以為多個(gè)語(yǔ)音源S提供接收角。例如，四源聲音源定位器可以為多至四個(gè)語(yǔ)音源提供接收角。例如，在游戲游玩空間中移動(dòng)并說(shuō)話的游戲玩家可以由聲音源定位器238跟蹤。在根據(jù)該示例的一場(chǎng)景中，生成用于供游戲控制臺(tái)顯示的圖像可以響應(yīng)于所跟蹤的玩家位置的變化而被調(diào)整，例如使得所顯示的角色的臉跟隨玩家的移動(dòng)。波束生成器230將定向自適應(yīng)聲音信號(hào)210輸出給噪聲抑制器217的第三階段，在其中，將噪聲抑制器217配置為應(yīng)用一個(gè)或多個(gè)非線性噪聲抑制技術(shù)來(lái)至少部分地基于已組合定向自適應(yīng)聲音信號(hào)210的方向特性來(lái)抑制該已組合定向自適應(yīng)聲音信號(hào)210的第二環(huán)境聲部分?？墒褂靡粋€(gè)或多個(gè)非線性音頻回音抑制器(AEQ Μ2、非線性空間濾波器 (SF) Μ4、固定噪聲抑制器(SNS)245以及自動(dòng)增益控制器(AGC) 246來(lái)執(zhí)行所述非線性噪聲抑制?？梢岳斫?，音頻輸入設(shè)備102的各種實(shí)施例可以任意合適的順序應(yīng)用所述非線性噪聲抑制技術(shù)。將非線性音頻回音抑制器242配置為抑制已組合定向自適應(yīng)聲音信號(hào)210的聲音量級(jí)偽像(sound magnitude artifact)，其中通過(guò)至少部分基于語(yǔ)音源S的方向確定并應(yīng) 用音頻回音增益來(lái)應(yīng)用該非線性音頻回音抑制器。在一些實(shí)施例中，非線性音頻回音抑制器242可以被配置為從已組合定向自適應(yīng)聲音信號(hào)210中移除殘余回波偽像。可以通過(guò)估計(jì)揚(yáng)聲器108和麥克風(fēng)205之間的功率傳遞函數(shù)來(lái)完成所述殘余回波偽像的移除。例如，音頻回音抑制器242可將依賴時(shí)間的增益應(yīng)用于與已組合定向自適應(yīng)聲音信號(hào)210相關(guān)聯(lián) 的不同頻率組(frequency bins)。在該示例中，應(yīng)用趨于零的增益給具有較大量環(huán)境聲和 /或揚(yáng)聲器聲音的頻率組，而將趨于一(approaching unity)的增益給具有較少量環(huán)境聲和/或揚(yáng)聲器聲音的頻率組。將非線性空間濾波器244配置為抑制已組合定向自適應(yīng)聲音信號(hào)210的聲音相偽像(sound phase artifact)，其中，通過(guò)至少部分基于語(yǔ)音源S的方向確定并應(yīng)用空間濾波增益來(lái)應(yīng)用該非線性空間濾波器M4。在一些實(shí)施例中，非線性空間濾波器244可以被配置為接收與每個(gè)數(shù)字聲音信號(hào)208相關(guān)聯(lián)的相差信息以估計(jì)多個(gè)頻率組的每個(gè)到達(dá)的方向。而且，所估計(jì)的到達(dá)方向可用于為每個(gè)頻率組計(jì)算所述空間濾波增益。例如，具有與語(yǔ)音源 S的方向不同的到達(dá)方向的頻率組可分配趨于零的空間濾波增益，而具有近似于語(yǔ)音源S 的方向的到達(dá)方向的頻率組可分配趨于一的空間濾波增益。將固定噪聲抑制器245配置為抑制剩余的背景噪聲，其中，通過(guò)至少部分基于剩余噪聲分量的統(tǒng)計(jì)模型確定并應(yīng)用抑制濾波增益來(lái)應(yīng)用該固定噪聲抑制器M5。而且，可以使用固定噪聲模型和當(dāng)前信號(hào)量級(jí)來(lái)為每個(gè)頻率組計(jì)算抑制濾波增益。例如，具有低于噪聲偏離的量級(jí)的頻率組可分配趨于零的抑制濾波增益，而具有遠(yuǎn)高于噪聲偏離的量級(jí)的頻率組可分配趨于一的抑制濾波增益。將自動(dòng)增益控制器246配置為調(diào)整已組合定向自適應(yīng)聲音信號(hào)210的音量增益，其中，通過(guò)至少部分基于語(yǔ)音源S的量級(jí)確定并應(yīng)用音量增益來(lái)應(yīng)用該自動(dòng)增益控制器 2460在一些實(shí)施例中，自動(dòng)增益控制器246可以被配置為補(bǔ)償聲音的不同音量能級(jí)例如，在第一游戲玩家以較柔和聲音說(shuō)話而第二游戲玩家以較響亮聲音說(shuō)話的場(chǎng)景中，自動(dòng)增益控制器246可以調(diào)整音量增益以減少這兩個(gè)玩家之間的音量差異。在一些實(shí)施例中，與自動(dòng)增益控制器M6的改變相關(guān)聯(lián)的時(shí)間常數(shù)近似為3-4秒。在音頻輸入設(shè)備102的一些實(shí)施例中，可使用包括聯(lián)合增益濾波器的非線性聯(lián)合抑制器M0，所述聯(lián)合增益濾波器是從多個(gè)單獨(dú)的增益濾波器中計(jì)算出的。例如，單獨(dú)的增益濾波器可以是由非線性音頻回音抑制器M2、非線性空間濾波器M4、固定噪聲抑制器 245,自動(dòng)增益控制器246等計(jì)算的增益濾波器?？梢岳斫飧鞣N非線性噪聲抑制技術(shù)的討論順序僅僅是示例順序，并且可以在音頻輸入設(shè)備102的各種實(shí)施例中使用其他合適的順序。經(jīng)過(guò)一個(gè)或多個(gè)非線性噪聲抑制技術(shù)的處理后，在頻-時(shí)域變換(FTD)模塊248 處將已組合定向自適應(yīng)聲音信號(hào)210從頻域變換成時(shí)域，輸出所導(dǎo)出的聲音信號(hào)沈0。可通過(guò)合適的變換算法發(fā)生頻域到時(shí)域的變換。例如，可使用如逆傅利葉變換、逆調(diào)制復(fù)重疊變換或逆快速傅利葉變換的變換算法。所導(dǎo)出的聲音信號(hào)260可以被本地使用或輸出給遠(yuǎn)程計(jì)算設(shè)備，例如，遠(yuǎn)程計(jì)算設(shè)備104。例如，在一場(chǎng)景中，所導(dǎo)出聲音信號(hào)260可以包括對(duì)應(yīng) 于人類語(yǔ)音的聲音信號(hào)，并且可與游戲音軌混合以在揚(yáng)聲器108輸出。圖3A和;3B示出用于抑制由麥克風(fēng)陣列所接收的語(yǔ)音中的環(huán)境聲的方法300的實(shí) 施例。可使用與圖1和2相關(guān)的如上所述的硬件和軟件組件或其他合適的硬件和軟件組件來(lái)實(shí)現(xiàn)方法300。方法300包括，在步驟302，接收在包括多個(gè)麥克風(fēng)的麥克風(fēng)陣列的每個(gè) 麥克風(fēng)處生成的模擬聲音信號(hào)，每個(gè)模擬聲音信號(hào)是至少部分從語(yǔ)音源接收的。繼續(xù)，方法 300包括，在步驟304，在模數(shù)轉(zhuǎn)換器處將每個(gè)模擬聲音信號(hào)轉(zhuǎn)換成具有第一較高位深度的對(duì)應(yīng)的第一數(shù)字聲音信號(hào)。在步驟306，方法300包括從揚(yáng)聲器信號(hào)源接收用于多個(gè)揚(yáng)聲器的多聲道揚(yáng)聲器信號(hào)。繼續(xù)，方法300包括，在步驟308，從揚(yáng)聲器信號(hào)源接收多聲道揚(yáng)聲器信號(hào)。在步驟310，方法300包括通過(guò)從遠(yuǎn)程計(jì)算設(shè)備接收時(shí)鐘信號(hào)將所述多聲道揚(yáng)聲器信號(hào)與每個(gè) 第一數(shù)字聲音信號(hào)同步。在步驟312，方法300包括為每個(gè)第一數(shù)字聲音信號(hào)生成多聲道揚(yáng)聲器信號(hào)的單聲道近似信號(hào)，該單聲道近似信號(hào)近似于對(duì)應(yīng)的麥克風(fēng)所接收的揚(yáng)聲器聲音。在一些實(shí)施例中，步驟312包括，在314，通過(guò)從揚(yáng)聲器發(fā)射校準(zhǔn)音頻信號(hào)、在每個(gè)麥克風(fēng)處檢測(cè)所述校準(zhǔn)音頻信號(hào)，并至少部分基于每個(gè)麥克風(fēng)的校準(zhǔn)信號(hào)生成單聲道近似信號(hào) 來(lái)為每個(gè)麥克風(fēng)確定校準(zhǔn)信號(hào)。可以理解，可以間歇執(zhí)行步驟314，例如在系統(tǒng)建立或啟動(dòng) 時(shí)，或者也可以在合適的地方更加頻繁地被執(zhí)行。繼續(xù)，方法300包括在步驟316，應(yīng)用線性音頻回音消除器以至少部分基于所述單聲道近似信號(hào)抑制每個(gè)第一數(shù)字聲音信號(hào)的第一環(huán)境聲部分。在步驟318，方法300包括在將線性音頻回音消除器應(yīng)用于每個(gè)數(shù)字聲音信號(hào)之后，將每個(gè)第一數(shù)字聲音信號(hào)轉(zhuǎn)換為具有第二較低位深度的第二數(shù)字聲音信號(hào)。在步驟320，方法300包括在生成已組合定向自適應(yīng)聲音信號(hào)之前，將線性固定音移除器應(yīng)用于每個(gè)第二數(shù)字聲音信號(hào)。繼續(xù)，在步驟322，方法300包括至少部分基于用于跟蹤語(yǔ)音源的時(shí)間恒定和/或自適應(yīng)波束生成技術(shù)的組合從每個(gè)第二數(shù)字聲音信號(hào)的組合中生成已組合定向自適應(yīng)聲音信號(hào)。在一些實(shí)施例中，步驟322包括，在步驟324，將一系列預(yù)定加權(quán)系數(shù)應(yīng)用到每個(gè)聲音信號(hào)，至少部分基于在麥克風(fēng)陣列的預(yù)定聲音接收區(qū)域中的各向同性的環(huán)境噪聲分布來(lái) 計(jì)算每個(gè)預(yù)定加權(quán)系數(shù)，并應(yīng)用聲音源定位器，以確定相對(duì)于麥克風(fēng)陣列的語(yǔ)音源S的接收角，并當(dāng)語(yǔ)音源S實(shí)時(shí)移動(dòng)時(shí)至少部分基于接收角跟蹤語(yǔ)音源。繼續(xù)，方法300包括，在步驟326，應(yīng)用一個(gè)或多個(gè)非線性噪聲抑制技術(shù)來(lái)至少部分地基于已組合定向自適應(yīng)聲音信號(hào)的方向特性來(lái)抑制該已組合定向自適應(yīng)聲音信號(hào)的第二環(huán)境聲部分。在一些實(shí)施例中，步驟3 包括，在步驟328，應(yīng)用一個(gè)或多個(gè)用于抑制聲音量級(jí)偽像的非線性音頻回音抑制器，其中通過(guò)基于語(yǔ)音源S的方向確定并應(yīng)用音頻回音增益來(lái)應(yīng)用該非線性音頻回音抑制器；用于抑制聲音相偽像的非線性空間濾波器，其中，通過(guò)基于語(yǔ)音源的時(shí)間特性確定并應(yīng)用空間濾波增益來(lái)應(yīng)用該非線性空間濾波器；非線性固定噪聲抑制器，其中通過(guò)至少部分基于剩余噪聲分量的統(tǒng)計(jì)模型確定并應(yīng)用抑制濾波增益來(lái)應(yīng)用該固定噪聲抑制器；和/或用于調(diào)整已組合定向自適應(yīng)聲音信號(hào)的音量增益的自動(dòng)增益控制器，其中，通過(guò)至少部分基于語(yǔ)音源S的相對(duì)音量確定并應(yīng)用音量增益來(lái)應(yīng)用該自動(dòng)增益控制器。在一些實(shí)施例中，步驟3 包括在步驟330，應(yīng)用包括聯(lián)合增益濾波器的非線性聯(lián)合噪聲抑制器，所述聯(lián)合增益濾波器是從多個(gè)單獨(dú)的增益濾波器中計(jì)算出的。繼續(xù)，方法300包括在步驟332，輸出所導(dǎo)出的聲音信號(hào)。可以理解，此處所描述的計(jì)算設(shè) 備可以是被配置成執(zhí)行此處所描述的程序的任何合適的計(jì)算設(shè)備。例如，計(jì)算設(shè)備可以是大型計(jì)算機(jī)、個(gè)人計(jì)算機(jī)、膝上計(jì)算機(jī)、便攜式數(shù)據(jù)助理(PDA)、啟用計(jì)算機(jī)的無(wú)線電話、聯(lián) 網(wǎng)計(jì)算設(shè)備或任意其他合適的計(jì)算設(shè)備。而且，可以理解，此處所描述的計(jì)算設(shè)備可以通過(guò) 計(jì)算機(jī)網(wǎng)絡(luò)，例如因特網(wǎng)，彼此連接。而且，可以理解，計(jì)算設(shè)備可以連接到網(wǎng)絡(luò)云環(huán)境中工作的服務(wù)器計(jì)算設(shè)備。此處描述的計(jì)算設(shè)備通常包括處理器和相關(guān)聯(lián)的易失性和非易失性存儲(chǔ)器，并被配置成使用易失性存儲(chǔ)器的各部分和處理器來(lái)執(zhí)行存儲(chǔ)在非易失性存儲(chǔ)器中的程序。如在此所使用，術(shù)語(yǔ)“程序”是指可以由一個(gè)或多個(gè)在此描述的計(jì)算設(shè)備執(zhí)行或使用的軟件或固件組件。而且，術(shù)語(yǔ)“程序”還表示為包括下述一項(xiàng)或多項(xiàng)可執(zhí)行文件、數(shù)據(jù)文件、庫(kù)、驅(qū)動(dòng)、腳本、數(shù)據(jù)庫(kù)記錄等?？梢岳斫猓商峁┚哂写鎯?chǔ)在其上的指令的計(jì)算機(jī)可讀介質(zhì)，所述指令使得計(jì)算設(shè)備執(zhí)行上述方法，并且在計(jì)算設(shè)備執(zhí)行指令時(shí)使得上述系統(tǒng)工作。應(yīng)該理解，此處所述的配置和/或方法在本質(zhì)上示例性的，且這些具體實(shí)施例或示例不是局限性的，因?yàn)槎鄠€(gè)變體是可能。此處所述的具體例程或方法可表示任何數(shù)量的處理策略中的一個(gè)或多個(gè)。由此，所示出的各個(gè)動(dòng)作可以按所示順序執(zhí)行、按其他順序執(zhí) 行、并行地執(zhí)行、或者在某些情況下省略。同樣，可以改變上述過(guò)程的次序。本發(fā)明的主題包括各種過(guò)程、系統(tǒng)和配置的所有新穎和非顯而易見(jiàn)的組合和子組合、和此處所公開(kāi)的其它特征、功能、動(dòng)作、和/或特性、以及其任何和全部等效方案。
權(quán)利要求
1.一種配置用于接收語(yǔ)音輸入的計(jì)算設(shè)備(102)，所述計(jì)算設(shè)備包括具有多個(gè)麥克風(fēng)O05)的麥克風(fēng)陣列(202)；與所述麥克風(fēng)陣列(202)有效通信的處理器014)。與所述麥克風(fēng)陣列(20 和所述處理器(214)有效通信的模數(shù)轉(zhuǎn)換器O07)；包括存儲(chǔ)在其上的指令的存儲(chǔ)器016)，所述指令由所述處理器(214)執(zhí)行以從所述模數(shù)轉(zhuǎn)換器(207)接收多個(gè)數(shù)字聲音信號(hào)008)，每個(gè)數(shù)字聲音信號(hào)是基于源自所述麥克風(fēng)陣列(202)的模擬聲音信號(hào)006)，從揚(yáng)聲器信號(hào)源(219)接收多聲道揚(yáng)聲器信號(hào)018)，對(duì)于每個(gè)數(shù)字聲音信號(hào)008)，生成所述多聲道揚(yáng)聲器信號(hào)的單聲道近似信號(hào)022)，所述單聲道近似信號(hào)(22 近似于由對(duì)應(yīng)的麥克風(fēng)所接收的揚(yáng)聲器聲音，應(yīng)用線性音頻回音消除器0沈)，以至少部分基于所述單聲道近似信號(hào)(222)來(lái)抑制每個(gè)數(shù)字聲音信號(hào)O08)的第一環(huán)境聲部分，至少部分基于時(shí)間恒定和自適應(yīng)波束生成技術(shù)的組合，從每個(gè)數(shù)字聲音信號(hào)O08)的組合中生成已組合定向自適應(yīng)聲音信號(hào)010)，應(yīng)用一個(gè)或多個(gè)非線性噪聲抑制技術(shù)，來(lái)至少部分地基于所述已組合定向自適應(yīng)聲音信號(hào)(210)的方向特性，來(lái)抑制所述已組合定向自適應(yīng)聲音信號(hào)(210)的第二環(huán)境聲部分。
2.如權(quán)利要求1所述的設(shè)備，其特征在于，所述指令進(jìn)一步由所述處理器執(zhí)行，以在生成所述已組合定向自適應(yīng)聲音信號(hào)之前，將線性固定音移除器應(yīng)用于每個(gè)數(shù)字聲音信號(hào)。
3.如權(quán)利要求1所述的設(shè)備，其特征在于，所述第二環(huán)境聲部分的抑制通過(guò)應(yīng)用下述一個(gè)或多個(gè)項(xiàng)發(fā)生用于抑制聲音量級(jí)偽像的非線性音頻回音抑制器，其中，通過(guò)至少部分基于語(yǔ)音源的方向確定并應(yīng)用音頻回音增益來(lái)應(yīng)用所述非線性音頻回音抑制器，用于抑制聲音相偽像的非線性空間濾波器，其中，通過(guò)至少部分基于所述語(yǔ)音源的方向確定并應(yīng)用空間濾波增益來(lái)應(yīng)用所述非線性空間濾波器，非線性固定噪聲抑制器，其中通過(guò)至少部分基于剩余噪聲分量的統(tǒng)計(jì)模型確定并應(yīng)用抑制濾波增益來(lái)應(yīng)用所述固定噪聲抑制器，和/或用于調(diào)整已組合定向自適應(yīng)聲音信號(hào)的音量增益的自動(dòng)增益控制器，其中，通過(guò)至少部分基于所述語(yǔ)音源的方向確定并應(yīng)用音量增益來(lái)應(yīng)用所述自動(dòng)增益控制器。
4.如權(quán)利要求1所述的設(shè)備，其特征在于，所述第二環(huán)境聲部分的抑制是通過(guò)應(yīng)用包括聯(lián)合增益濾波器的非線性聯(lián)合抑制器來(lái)發(fā)生的，所述聯(lián)合增益濾波器是從多個(gè)單獨(dú)的增益濾波器中計(jì)算出的。
5.如權(quán)利要求1所述的設(shè)備，其特征在于，所述指令進(jìn)一步由所述處理器執(zhí)行以通過(guò)從多個(gè)揚(yáng)聲器的每個(gè)發(fā)射校準(zhǔn)音頻信號(hào)并在每個(gè)麥克風(fēng)處檢測(cè)所述校準(zhǔn)音頻信號(hào)，來(lái)為每一個(gè)麥克風(fēng)確定一校準(zhǔn)信號(hào)，并且至少部分基于每個(gè)麥克風(fēng)的所述校準(zhǔn)信號(hào)，確定所述單聲道近似信號(hào)。
6.如權(quán)利要求1所述的設(shè)備，其特征在于，所述模數(shù)轉(zhuǎn)換器配置為將每個(gè)麥克風(fēng)生成的模擬聲音信號(hào)在所述模數(shù)轉(zhuǎn)換器處轉(zhuǎn)換為對(duì)應(yīng)的數(shù)字聲音信號(hào)，其中，來(lái)自每個(gè)麥克風(fēng) 的每個(gè)數(shù)字聲音信號(hào)具有第一較高位深度，并且其中，所述指令進(jìn)一步由所述處理器執(zhí)行以在將所述線性音頻回音消除器應(yīng)用于每個(gè)數(shù)字聲音信號(hào)之后，將每個(gè)數(shù)字聲音信號(hào)轉(zhuǎn)換為具有第二較低位深度的數(shù)字聲音信號(hào)。
7.如權(quán)利要求1所述的設(shè)備，其特征在于，所述模數(shù)轉(zhuǎn)換器配置為通過(guò)從遠(yuǎn)程計(jì)算設(shè) 備接收的時(shí)鐘信號(hào)，將所述多聲道揚(yáng)聲器信號(hào)與每個(gè)數(shù)字聲音信號(hào)同步。
8.如權(quán)利要求1所述的設(shè)備，其特征在于，所述麥克風(fēng)在所述麥克風(fēng)陣列中彼此不均勻間隔。
9.如權(quán)利要求1所述的設(shè)備，其特征在于，用于生成所述已組合定向自適應(yīng)聲音信號(hào) 的時(shí)間恒定和自適應(yīng)波束生成技術(shù)的組合包括指令，所述指令由所述處理器執(zhí)行以將一系列預(yù)定加權(quán)系數(shù)應(yīng)用到每個(gè)數(shù)字聲音信號(hào)，至少部分基于在所述麥克風(fēng)陣列的預(yù)定聲音接收區(qū)域中的各向同性的環(huán)境噪聲分布來(lái)計(jì)算每個(gè)預(yù)定加權(quán)系數(shù)；并且應(yīng)用聲音源定位器以確定相對(duì)于所述麥克風(fēng)陣列的語(yǔ)音源的接收角，并當(dāng)所述語(yǔ)音源實(shí)時(shí)移動(dòng)時(shí)至少部分基于所述接收角跟蹤所述語(yǔ)音源。
10.一種用于抑制由麥克風(fēng)陣列接收的語(yǔ)音中的環(huán)境聲的方法，在存儲(chǔ)器處包括了存儲(chǔ)在其上的指令，所述指令由處理器執(zhí)行以從模數(shù)轉(zhuǎn)換器接收多個(gè)數(shù)字聲音信號(hào)(306)，每個(gè)數(shù)字聲音信號(hào)基于源自所述麥克風(fēng) 陣列的模擬聲音信號(hào)；從揚(yáng)聲器信號(hào)源接收多聲道揚(yáng)聲器信號(hào)(308)；為每個(gè)數(shù)字聲音信號(hào)生成所述多聲道揚(yáng)聲器信號(hào)的單聲道近似信號(hào)(312)，所述單聲道近似信號(hào)近似于由對(duì)應(yīng)的麥克風(fēng)所接收的揚(yáng)聲器聲音；應(yīng)用線性音頻回音消除器(316)以至少部分基于單聲道近似信號(hào)來(lái)抑制每個(gè)數(shù)字聲音信號(hào)的第一環(huán)境聲部分；至少部分基于時(shí)間恒定和自適應(yīng)波束生成技術(shù)的組合，從每個(gè)數(shù)字聲音信號(hào)的組合中生成已組合定向自適應(yīng)聲音信號(hào)(322)；應(yīng)用一個(gè)或多個(gè)非線性噪聲抑制技術(shù)(326)來(lái)至少部分地基于所述已組合定向自適應(yīng)聲音信號(hào)的方向特性來(lái)抑制所述已組合定向自適應(yīng)聲音信號(hào)的第二環(huán)境聲部分；以及輸出所得到的聲音信號(hào)。
11.如權(quán)利要求10所述的方法，其特征在于，為每個(gè)數(shù)字聲音信號(hào)生成所述多聲道揚(yáng) 聲器信號(hào)的單聲道近似信號(hào)，所述單聲道近似信號(hào)近似于由對(duì)應(yīng)的麥克風(fēng)所接收的揚(yáng)聲器聲音進(jìn)一步包括通過(guò)從多個(gè)揚(yáng)聲器的每個(gè)發(fā)射校準(zhǔn)音頻信號(hào)來(lái)為每一個(gè)麥克風(fēng)確定一校準(zhǔn)信號(hào)；在每個(gè)麥克風(fēng)處檢測(cè)所述校準(zhǔn)音頻信號(hào)；以及至少部分基于每個(gè)麥克風(fēng)的所述校準(zhǔn)信號(hào)生成所述單聲道近似信號(hào)。
12.如權(quán)利要求10所述的方法，其特征在于，應(yīng)用一個(gè)或多個(gè)非線性噪聲抑制技術(shù)來(lái) 至少部分地基于已組合定向自適應(yīng)聲音信號(hào)的方向特性來(lái)抑制所述已組合定向自適應(yīng)聲音信號(hào)的第二環(huán)境聲部分，進(jìn)一步包括應(yīng)用下述一個(gè)或多個(gè)項(xiàng)用于抑制聲音量級(jí)偽像的非線性音頻回音抑制器，其中，通過(guò)基于語(yǔ)音源的方向確定并應(yīng)用音頻回音增益來(lái)應(yīng)用所述非線性音頻回音抑制器，用于抑制聲音相偽像的非線性空間濾波器，其中，通過(guò)基于所述語(yǔ)音源的時(shí)間特性確定并應(yīng)用空間濾波增益來(lái)應(yīng)用所述非線性空間濾波器，非線性固定噪聲抑制器，其中，通過(guò)至少部分基于剩余噪聲分量的統(tǒng)計(jì)模型確定并應(yīng)用抑制濾波增益來(lái)應(yīng)用所述固定噪聲抑制器，和/或用于調(diào)整已組合定向自適應(yīng)聲音信號(hào)的音量增益的自動(dòng)增益控制器，其中，通過(guò)至少部分基于所述語(yǔ)音源的相對(duì)音量確定并應(yīng)用音量增益來(lái)應(yīng)用所述自動(dòng)增益控制器。
13.如權(quán)利要求10所述的方法，其特征在于，應(yīng)用一個(gè)或多個(gè)非線性噪聲抑制技術(shù)來(lái) 至少部分地基于已組合定向自適應(yīng)聲音信號(hào)的量級(jí)和/或時(shí)間特性來(lái)抑制所述已組合定向自適應(yīng)聲音信號(hào)的第二環(huán)境聲部分進(jìn)一步包括應(yīng)用包括聯(lián)合增益濾波器的非線性聯(lián)合抑制器，所述聯(lián)合增益濾波器是從多個(gè)單獨(dú)的增益濾波器中計(jì)算出的。
14.如權(quán)利要求10所述的方法，其特征在于，還包括將每個(gè)麥克風(fēng)生成的模擬聲音信號(hào)在所述模數(shù)轉(zhuǎn)換器處轉(zhuǎn)換為對(duì)應(yīng)的數(shù)字聲音信號(hào)，其中，來(lái)自每個(gè)麥克風(fēng)的每個(gè)數(shù)字聲音信號(hào)具有第一較高位深度；以及在將線性音頻回音消除器應(yīng)用于每個(gè)數(shù)字聲音信號(hào)之后，將每個(gè)數(shù)字聲音信號(hào)轉(zhuǎn)換為具有第二較低位深度的數(shù)字聲音信號(hào)。
15.如權(quán)利要求10所述的方法，其特征在于，至少部分基于時(shí)間恒定和自適應(yīng)波束生成技術(shù)的組合從每個(gè)數(shù)字聲音信號(hào)的組合中生成已組合定向自適應(yīng)聲音信號(hào)以跟蹤所述語(yǔ)音源進(jìn)一步包括將一系列預(yù)定加權(quán)系數(shù)應(yīng)用到每個(gè)數(shù)字聲音信號(hào)，至少部分基于在所述麥克風(fēng)陣列的預(yù)定聲音接收區(qū)域中的各向同性的環(huán)境噪聲分布來(lái)計(jì)算每個(gè)預(yù)定加權(quán)系數(shù)，并且應(yīng)用聲音源定位器以確定相對(duì)于所述麥克風(fēng)陣列的語(yǔ)音源的接收角，并當(dāng)語(yǔ)音源實(shí)時(shí) 移動(dòng)時(shí)至少部分基于所述接收角跟蹤所述語(yǔ)音源。
全文摘要
提供了一種用于抑制麥克風(fēng)陣列所接收的語(yǔ)音中的環(huán)境聲的設(shè)備。該設(shè)備的一實(shí)施例包括麥克風(fēng)陣列、處理器、模數(shù)轉(zhuǎn)換器和包括存儲(chǔ)在其上由處理器執(zhí)行的指令的存儲(chǔ)器。存儲(chǔ)在存儲(chǔ)器上的指令被配置為接收多個(gè)數(shù)字聲音信號(hào)，每個(gè)數(shù)字聲音信號(hào)基于源自麥克風(fēng)陣列的模擬聲音信號(hào)，接收多聲道揚(yáng)聲器信號(hào)，生成多聲道揚(yáng)聲器信號(hào)的單聲道近似信號(hào)，應(yīng)用線性音頻回音消除器以抑制每個(gè)數(shù)字聲音信號(hào)的第一環(huán)境聲部分，通過(guò)時(shí)間恒定和自適應(yīng)波束生成技術(shù)的組合從每個(gè)數(shù)字聲音信號(hào)的組合中生成已組合定向自適應(yīng)聲音信號(hào)，并應(yīng)用一個(gè)或多個(gè)非線性噪聲抑制技術(shù)來(lái)抑制已組合定向自適應(yīng)聲音信號(hào)的第二環(huán)境聲部分。
文檔編號(hào)H04R1/08GK102131136SQ20111003092
公開(kāi)日2011年7月20日申請(qǐng)日期2011年1月19日優(yōu)先權(quán)日2010年1月20日
發(fā)明者D·麥克凱, I·塔舍夫, J·塔迪夫, J·弗萊克斯, L·興, M·巴塞夫勒格, R·海特坎普, W·郭, 倪旭東申請(qǐng)人:微軟公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：J·弗萊克斯;I·塔舍夫;D·麥克凱;倪旭東;R·海特坎普;W·郭;J·塔迪夫;L·興;M·巴塞夫勒格
技術(shù)所有人：微軟公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

自適應(yīng)濾波器語(yǔ)音去噪相關(guān)技術(shù)

自適應(yīng)非極大值抑制相關(guān)技術(shù)

語(yǔ)音環(huán)境相關(guān)技術(shù)

嘈雜環(huán)境下語(yǔ)音識(shí)別相關(guān)技術(shù)

腫瘤免疫抑制微環(huán)境相關(guān)技術(shù)

微信語(yǔ)音沒(méi)聲音相關(guān)技術(shù)

日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

自適應(yīng)環(huán)境聲抑制和語(yǔ)音跟蹤的制作方法