日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

用于話音信號提取的方法和設(shè)備的制作方法

文檔序號:7658651閱讀:271來源:國知局
專利名稱:用于話音信號提取的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及基于語音的系統(tǒng)中的噪聲減少領(lǐng)域。特別地,本發(fā)明涉及從信號環(huán)境中提取目標(biāo)音頻信號。
背景技術(shù)
基于語音的系統(tǒng)和技術(shù)日益變得平常,其中一些較受歡迎的配置是依賴于語音識別功能的蜂窩電話機、手持計算裝置和系統(tǒng)。因此,隨著基于語音的技術(shù)變得日益平常,這樣的基于語音的技術(shù)的增長和用戶接受的主要障礙是污染語音信號并使語音處理結(jié)果的性能與質(zhì)量惡化的噪聲或干擾源。諸如噪聲消除濾波器和噪聲消除話筒的當(dāng)前商業(yè)補救方法已不足以對付許多真實情況,這些補救方法至多提供有限的改善并且有時使事情更加惡化。
在從環(huán)境中存在的包括其他語音源的物體發(fā)出的聲音波與利用需要的語音源生成的聲音波混合并干擾此聲音波時,出現(xiàn)語音信號的噪聲污染。干擾沿三個方面出現(xiàn),這些方面是時間、頻率和到達(dá)方向。多個聲音波同時在接收傳感器或裝置上登記的結(jié)果是出現(xiàn)時間重疊。在混合具有公共頻率成分的聲音源時,頻率或頻譜重疊出現(xiàn)并且特別麻煩。因為聲音源可能占據(jù)接收裝置周圍的任何位置并因而在相應(yīng)聲音波的傳播中呈現(xiàn)類似的方向?qū)傩?,所以出現(xiàn)到達(dá)方向的重疊。
時間重疊導(dǎo)致在聲音傳感器或話筒上接收混合信號。此混合信號包含聲音源的屬性組合,使聲音質(zhì)量以及此信號后續(xù)處理的結(jié)果惡化。時間重疊的一般解決方案通過區(qū)分頻率、內(nèi)容或到達(dá)方向的信號屬性來區(qū)別在時間上重疊的信號。然而,這些一般解決方案不能區(qū)分在時間、頻譜或到達(dá)時間上同時重疊的信號。
可將通常技術(shù)一般分成兩個通用組空間濾波器組;和頻率濾波器組??臻g濾波器組采用空間濾波器,根據(jù)各個信號的到達(dá)方向來區(qū)分信號。因此,頻率濾波器組采用頻率濾波器,根據(jù)各個信號的頻率特性來區(qū)分信號。
至于頻率濾波器,在從多個源始發(fā)的信號未在頻譜上重疊并且知道這些信號的頻譜內(nèi)容時,一組頻率濾波器(諸如,低通濾波器、帶通濾波器、高通濾波器或這些濾波器的一些組合)能夠用于解決此問題。頻率濾波器用于濾除不是需要信號成分的頻率成分。因而,頻率濾波器在通過抑制伴隨的環(huán)繞干擾音頻信號隔離特定的需要信號方面提供有限的改善。然而,典型的基于頻率濾波器的解決方案還不能區(qū)分在頻率內(nèi)容(即,頻譜)上重疊的信號。
噪聲抑制的示例性基于頻率的方法是頻譜相減,在講話者安靜的時間期間記錄噪聲內(nèi)容并從講話者講話時記錄的信號中減去此噪聲內(nèi)容的頻譜。這可能產(chǎn)生不自然的效果并且不利地與噪聲信號一起除去一些語音信號。
在從多個源始發(fā)的信號在其到達(dá)方向方面極少重疊或不重疊并且知道需要信號的到達(dá)方向時,利用空間濾波器能夠在很大程度上解決此問題。許多陣列話筒利用空間濾波技術(shù)。方向性話筒也提供從此話筒的非優(yōu)選方向到達(dá)的信號的一些衰減。例如,通過將方向性話筒舉到嘴邊,講話者能保證方向性話筒主要拾取他/她的話音。然而,方向性話筒不能解決由于時間和頻譜中的重疊而引起的問題。
因此,當(dāng)前技術(shù)與許多其他的競爭噪聲取消技術(shù)一樣抑制噪聲,這不一定得到需要信號的隔離,這是因為此需要信號的某些部分在濾波處理期間實際上容易被濾除或被破壞。而且,為了在設(shè)計參數(shù)內(nèi)操作,典型技術(shù)一般要求干擾聲音或從不同方向到達(dá)或包含不同的頻率成分。因此,當(dāng)前技術(shù)限于規(guī)定的聲學(xué)領(lǐng)域和環(huán)境條件。
結(jié)果,用于產(chǎn)生干凈音頻信號的典型技術(shù)具有未解決要求同時考慮所有環(huán)境(例如,時間上的重疊、到達(dá)方向上的重疊、頻譜上的重疊)的許多實際情況的缺點。因而,需要通過考慮所有類型的信號干擾來解決許多實際噪聲情況的設(shè)備和方法。

發(fā)明內(nèi)容
提供一種方法用于定位具有至少兩個話筒單元的話筒布置(arrangement)的各個單元。在估算需要信號源的可能位置以及干擾信號源的可能位置之后,定義一組準(zhǔn)則用于信號處理系統(tǒng)的可接受性能。此信號處理系統(tǒng)區(qū)分需要信號和干擾這些需要信號的信號。在定義準(zhǔn)則之后,將話筒布置的第一單元定位在常規(guī)位置上。所定義的準(zhǔn)則對后續(xù)話筒單元的設(shè)置施加限制。對于兩個話筒布置來說,此準(zhǔn)則可以包括避免導(dǎo)致相同信號利用兩個話筒單元登記的話筒設(shè)置;和定位話筒單元,以使這兩個話筒單元上登記的干擾聲音源具有類似特征。對于具有兩個以上的話筒單元的話筒布置來說,可以放松一些準(zhǔn)則,或可以增加另外的限制。不管話筒布置中的話筒單元的數(shù)量如何,以保證符合定義的用于特定數(shù)量話筒的準(zhǔn)則組的方式來定位話筒布置的后續(xù)單元。
這些定位方法用于提供許多話筒陣列或布置。提供這樣的話筒布置的許多示例,其中一些示例與日常物體組合。還有,這些方法用于提供輸入數(shù)據(jù)給信號處理系統(tǒng)或語音處理系統(tǒng)進(jìn)行聲音鑒別。而且,增強與擴展信號處理系統(tǒng)或語音處理系統(tǒng)以進(jìn)行將話筒布置用做傳感器前端的聲音鑒別。這些話筒陣列組合在許多電子裝置中。
本文中提供的描述是示例性和解釋性的并且用于提供所要求保護(hù)的發(fā)明的示例。


這些附圖表示所要求保護(hù)的發(fā)明的實施例。在這些附圖中圖1是與一個實施例的話音提取系統(tǒng)一起使用的用于確定話筒設(shè)置的方法流程圖;圖2表示滿足設(shè)置準(zhǔn)則的一個實施例的兩個話筒的布置;圖3是一個實施例的兩話筒布置的具體圖;圖4A與4B表示一個實施例的話音提取系統(tǒng)的兩話筒布置;圖5A與5B表示一個實施例的話音提取系統(tǒng)的可替換的兩話筒布置;圖6A與6B表示一個實施例的話音提取系統(tǒng)的附加可替換的兩話筒布置;圖7A與7B表示一個實施例的話音提取系統(tǒng)的其他可替換的兩話筒布置;圖8是表示相對話筒的多個信號源設(shè)置的一個實施例的兩話筒布置的俯視圖;圖9表示各種手持裝置上一個實施例的話筒陣列設(shè)置;圖10表示汽車電信息通信系統(tǒng)中一個實施例的話筒陣列設(shè)置;圖11表示安裝在一對眼鏡或遮光板上的一個實施例的話音提取系統(tǒng)的兩話筒布置;圖12表示安裝在塞繩上的一個實施例的話音提取系統(tǒng)的兩話筒布置;圖13A-C表示安裝在鋼筆或其他書寫或指示儀器上的一個實施例的話音提取系統(tǒng)的兩話筒布置;圖14表示一個實施例的話音提取系統(tǒng)的許多兩話筒布置;圖15表示具有兩個以上話筒的一個實施例的話筒陣列;圖16表示具有兩個以上話筒的一個實施例的另一話筒陣列;圖17表示具有兩個以上話筒的一個實施例的可替換話筒陣列;圖18表示具有兩個以上話筒的一個實施例的另一可替換話筒陣列;圖19A-C表示具有兩個以上話筒的一個實施例的其他可替換話筒陣列;圖20A與20B表示典型的前饋與反饋信號分離結(jié)構(gòu);圖21A表示接收兩個輸入和提供兩個輸出的一個實施例的示意性話音提取結(jié)構(gòu)的方框圖;圖21B表示接收兩個輸入和輸出五個輸出的一個實施例的話音提取結(jié)構(gòu)的方框圖;圖22A-D表示在一個實施例中使用的四種類型的話筒方向圖。
具體實施例方式
用于在信號處理系統(tǒng)中執(zhí)行盲信號分離的方法與系統(tǒng)公開在引入在此作為參考的題為“Method and Apparatus for Blind SignalSeparation”的美國申請系列號09/445778中。還有,此信號處理系統(tǒng)與方法擴展為包括根據(jù)引入在此作為參考的題為“Adaptive StateSpace Signal Separation,Discrimination and RecoveryArchitectures and Their Adaptations for Use in DynamicEnvironments”美國申請系列號09/701920中的狀態(tài)空間方案的反饋結(jié)構(gòu)。這些待審專利公開能夠應(yīng)用于利用能登記接收信號類型的傳感器接收的許多類型的信號的信號分離、鑒別和恢復(fù)的一般技術(shù),也公開利用這些信號處理技術(shù)的聲音鑒別系統(tǒng)或話音提取系統(tǒng)。分離和獲取需要的單個話音信號而至少部分地?zé)o其他聲音或幾乎不被其他聲音阻礙或掩蔽的處理在此稱為“話音提取”一個實施例的話音提取系統(tǒng)隔離需要的單個話音信號和混合或組合環(huán)境的干擾聲音源,以提供純話音信號給包括例如語音壓縮、傳輸和識別系統(tǒng)的語音處理系統(tǒng)。隔離特別包括從出現(xiàn)在此環(huán)境中和/或利用一個或多個聲音傳感裝置登記的所有聲音之和中分離和隔離目標(biāo)話音信號。出現(xiàn)的聲音包括背景聲、噪聲、多個講話者話音和需要話音,這些聲音全部在時間、空間和頻率上重疊。
需要的單話音信號可能從任何方向到達(dá),并且此方向可能是知道或不知道的。而且,在任何給定時間可能具有一個以上的單信號源。尤其在將盲信號分離與自適應(yīng)狀態(tài)空間信號分離、鑒別和恢復(fù)技術(shù)應(yīng)用于真實聲學(xué)環(huán)境的音頻信號處理的情況中,聲音或信號接收裝置或話筒的設(shè)置能夠影響話音提取系統(tǒng)的性能。因此,話筒布置或設(shè)置是話音提取系統(tǒng)的一個重要方面。
特別地,一個實施例的話音提取系統(tǒng)區(qū)分在時間、頻率和到達(dá)方向上重疊的干擾信號。此隔離基于話筒之間在信號幅度和獨立信號源的統(tǒng)計特性中的差異,即基于與根據(jù)到達(dá)方向或頻譜內(nèi)容區(qū)分干擾信號的典型技術(shù)相反的技術(shù)。此話音提取系統(tǒng)不僅對單個版本的聲音源信號執(zhí)行信號提取,而且還對每個聲音信號的多個延遲版本執(zhí)行信號提取。此系統(tǒng)不引入頻譜或相位失真。
將信號分離用于話音提取在接收話筒布置或陣列的設(shè)計中牽涉幾個實施問題。一個問題涉及在單獨或與話音提取結(jié)合或利用其他的信號處理方法檢測需要的單話音信號(以及干擾聲音)時使用的話筒的類型和布置。另一問題涉及布置兩個或多個話筒用于話音提取以獲得最佳性能的方法。還一問題是確定方法用于緩沖和時間延遲信號或反而處理接收的信號以保持因果律(causality)。又一問題是確定方法用于導(dǎo)出核心信號處理結(jié)構(gòu)的分支來處理不確定系統(tǒng),其中能夠與其他信號區(qū)分開來的信號源的數(shù)量大于接收機的數(shù)量。一個示例是僅僅利用兩個聲音傳感器能夠從三個或多個信號之和中提取需要的單個信號源。
圖1是用于與一個實施例的話音提取系統(tǒng)一起使用的用于確定話筒設(shè)置的方法流程圖。通過考慮在特定情況中話音源或需要信號源能占據(jù)的所有定位開始操作,步驟102。也考慮特定情況中干擾聲音源能占據(jù)的所有可能位置,步驟104。定義用于需要設(shè)備和裝置中可接受的話音提取性能的準(zhǔn)則,步驟106。研究話筒布置,并布置話筒,步驟108。隨后,將此話筒布置與這些準(zhǔn)則進(jìn)行比較,以確定是否違背任何唯則,步驟110。如果違背任何準(zhǔn)則,則研究新的布置,步驟108。如果未違背任何準(zhǔn)則,則形成原型話筒布置,步驟112,并測試此布置的性能,步驟114。如果此原型布置呈現(xiàn)可接受性能,則最后確定此原型布置,步驟116。不可接受的單元性性能導(dǎo)致研究可替換的話筒布置,步驟108。
用于提取單個信號源的兩話筒系統(tǒng)在包括一個實施例的話音提取系統(tǒng)的許多音頻處理系統(tǒng)使用至少兩個話筒或兩個話筒單元時具有特別意義。而且,許多音頻處理系統(tǒng)只協(xié)調(diào)最多兩個話筒。因此,現(xiàn)在描述兩話筒設(shè)置模型。
兩個話筒用于在任何給定時間距離至多兩個需要的信號源。換句話說,來自兩個傳感器或話筒單元的兩個輸入暗示基于信號分離的通用話音提取系統(tǒng)能生成兩個輸出。在此所述的擴展技術(shù)用于生成較大或較少數(shù)量的輸出。
因為在許多情況中可能具有許多干擾源和需要的單個信號,所以人們時常對從所有其他干擾源中隔離出單個聲音源(例如,諸如蜂窩電話機裝置的用戶的話音)感興趣。在也可能具有非常廣泛應(yīng)用的此特定情況中,考慮許多設(shè)置準(zhǔn)則,從此布置中具有兩個話筒以及聲音源和干擾源具有許多可能的位置組合的事實中推導(dǎo)出這些設(shè)置準(zhǔn)則。首先考慮的是使需要的單個源與所有干擾源之和進(jìn)行不同線性組合的需要。另一考慮是盡可能類似地登記干擾源之和的需要,以使利用一個話筒登記的和非常類似于利用另一話筒登記的和。第三考慮是將兩個輸出信道之一設(shè)計為最可能獲取需要信號源的輸出。
第一設(shè)置準(zhǔn)則由于系統(tǒng)奇異性(singularity)限制的結(jié)果而出現(xiàn),此系統(tǒng)在兩個話筒提供冗余信息時失效。雖然真的奇異性在真實世界中難以實現(xiàn),但數(shù)字評估在來自登記需要的話音信號和其他聲音的組合的兩個傳感器的輸入接近奇異點時變得更加不方便而且更加需要。因此,為了獲得最佳性能,話筒布置通過使奇異區(qū)域以及利用兩個聲音傳感器生成的奇異組輸出的概率最小應(yīng)控制盡可能遠(yuǎn)離奇異性。應(yīng)注意,奇異性限制利用多次復(fù)雜的數(shù)字處理是可以克服的。
第二設(shè)置準(zhǔn)則由于存在污染來自需要的單個信號源的聲音信號的許多干擾聲音源的結(jié)果而出現(xiàn)。此次問題要求重新形成信號分離問題的典型表示,這提供限制框架,其中利用兩個話筒只能相互區(qū)分兩個不同的信號源。在許多實際情況中,不是第二單個干擾源,而存在許多干擾源之和。如果許多信號源之和用作兩個話筒的單個源,能夠返回到典型問題陳述。假定,需要信號源的位置時常比干擾源能夠占據(jù)的位置更靠近,這是合理的近似。因為干擾源經(jīng)常遠(yuǎn)離需要的單個源,其話筒之間的幅度差異比利用假定更靠近這些話筒的需要的單個信號源生成的話筒之間的幅度差異低得多。
如下解釋第三準(zhǔn)則。在許多應(yīng)用情況中,話音提取必須實施為由有限脈沖響應(yīng)(FIR)和/或無限脈沖響應(yīng)(IIR)濾波器構(gòu)成的信號處理系統(tǒng)。為了可實現(xiàn)為由FIR或IIR濾波器組成的模擬或數(shù)字信號處理系統(tǒng),系統(tǒng)必須遵循因果律。因果律的一個限制是它阻止估算還未獲得的源信號值,即超越時刻(t)的信號值。即,濾波器只能估算時刻(t-δ)的源值,其中δ為非負(fù)值。結(jié)果,相對時間指定“需要源”話筒,以使之總是首先接收需要信號源。此話筒接收時間(t)的需要信號源,而第二話筒接收時間延遲(t-δ)的信號。在這種情況中,將利用這兩個話筒之間的間距、需要信號源的位置和傳播聲音波的速度來確定δ。此要求利用其中通過減去干擾信號來查找源信號的反饋結(jié)構(gòu)進(jìn)一步得到加強。
利用一組特定話筒類型與方向圖、設(shè)置位置和屬性的進(jìn)一步分析和實驗支持在提到的參數(shù)和分離程度或話音提取成功之間建立一組關(guān)系。這三個準(zhǔn)則用作查找此空間的指南。
圖2表示滿足設(shè)置準(zhǔn)則的一個實施例的兩個話筒的布置200。圖3是一個實施例的兩個話筒布置的具體圖300。單個話音源利用S來表示。從噪聲源到達(dá)的信號利用N來表示,現(xiàn)在提供一種分析,其中此布置表示為遵循此設(shè)置準(zhǔn)則。
需要的主要信號源S位于距第一話筒(m1)r單位距離并距第二話筒(m2)r+d單位距離處。干擾信號源S的是多個噪聲源,例如位于距這些話筒不同距離處的N0和Nθ。干擾噪聲源分別利用偽噪聲源Nθ來近似,每個偽噪聲位于半徑為R的圓上,其中心為第二話筒(m2)。噪聲源的下標(biāo)指示其角度位置(θ),即從噪聲源至連接這兩個話筒的線中點的視線和連接這兩個話筒的線之間的角度。
將第二話筒選擇為中心是為了方便并且是將第二話筒表示為所有干擾源之和的一種方式。注意,此表示不是嚴(yán)格的,這是具有需要信號源的情況,并且不表示利用噪聲源生成的信號在它們到達(dá)第一話筒之前到達(dá)第二話筒。事實上,在θ>180時,相反的是正確的。而且,每個偽噪聲源假定由于它正在接近的實際噪聲源的距離而生成平面波前端。每個干擾偽噪聲源距第二話筒為R單位距離并距第一話筒為R+dsin(θ)單位距離。
如果給定這些近似值,每個話筒上具有的實際信號如下進(jìn)行估算m1(t)=S(t)r+ΣθNθ(t-dsin(θ)v)R+dsin(θ)]]>m2(t)=S(t-dv)r+d+ΣθNθ(t)R]]>其中v為傳播聲音波的速度。從這些等式中看出,這兩個話筒具有單個需要信號源與所有干擾源之和的不同線性組合。通過將第一話筒表示為“需要話筒的信號源”,將第一輸出信道表示為最有可能獲取需要信號源的輸出。因而,容易滿足第一與第三設(shè)置準(zhǔn)則。滿足第二準(zhǔn)則的程度(即,盡可能類似地登記干擾源之和)是這兩個話筒之間距離d的函數(shù)。使d為小值有助于滿足第二準(zhǔn)則,但可能損害第一與第三準(zhǔn)則。因而,d值的選擇是這些相互沖突的限制之間的折衷。實際上,發(fā)現(xiàn)大致在0.5英寸至4英寸范圍內(nèi)的距離產(chǎn)生令人滿意的性能。
對于多個需要信號源和兩個以上話筒的設(shè)置,設(shè)置準(zhǔn)則應(yīng)用于兩個以上話筒的設(shè)置要求修改此準(zhǔn)則。第一準(zhǔn)則修改為包括進(jìn)行多個需要源與所有干擾源之和的不同線性組合的需要,第二準(zhǔn)則修改為包括盡可能類似地登記干擾源之和以使一個和非常類似于另一和的需要。第三準(zhǔn)則修改為包括將一組多個輸出信道表示為最可能獲取多個需要信號源的輸出并對于其對應(yīng)的需要信號源標(biāo)記每個信道的需要。利用一組特定話筒類型與方向圖、設(shè)置定位以及相對信號傳播與目標(biāo)聲音環(huán)境的屬性的進(jìn)一步分析和實驗支持確定對于利用兩個以上話筒的話音提取是合適或最佳的特定布置與間距。
在許多應(yīng)用中,話音提取實施為由FIR和/或IIR濾波器構(gòu)成的信號處理系統(tǒng)。為了可實現(xiàn)為由FIR或IIR濾波器組成的模擬或數(shù)字信號處理系統(tǒng),系統(tǒng)得遵循因果律?,F(xiàn)在描述一直保持因果律的技術(shù)。
參見圖3,對于干擾噪聲源Nθ,其中180<θ<360,數(shù)量d sin(θ)<0。在這種情況中,第一話筒等式中的相加單元Nθ指未來的時刻并且因而還未獲得的時刻。此因果律的損害能夠通過適當(dāng)?shù)匮舆t第一話筒信號來彌補。如果將第一話筒延遲數(shù)量d/v,則話筒等式寫為m1(t-dv)=S(t-dv)r+ΣθNθ(t-dsin(θ)v-dv)R+dsin(θ)]]>m2(t)=S(t-dv)r+d+ΣθNθ(t)R]]>現(xiàn)在,兩個時間延遲版本的語音源和第一話筒定義為S′(t)=S(t-dv)]]>m1′(t)=m1(t-dv)]]>利用這些定義,用于話筒信號的新等式能夠?qū)憺閙1′(t)=S′(t)r+ΣθNθ(t-d(1+sin(θ))v)R+dsin(θ)]]>m2(t)=S′(t)r+d+ΣθNθ(t)R]]>因為(1+sin(θ))總是大于或等于零,所以利用延遲補償修改,所有項表示當(dāng)前或過去時刻并因而維持因果律限制。利用此方法,能夠增加能提取的需要話音(或其他聲音)源的數(shù)量。
一個實施例的話音提取系統(tǒng)利用盲信號分離來處理至少兩個信號的信息。此信息利用兩個話筒進(jìn)行接收。由于許多話音信號處理系統(tǒng)只可以協(xié)調(diào)至多兩個話筒,所以根據(jù)本文所述的技術(shù)提供許多兩話筒設(shè)置。
本文所提供的兩話筒布置區(qū)分單個講話者的話音與此環(huán)境中出現(xiàn)的所有其他聲音源之和(不管是環(huán)境噪聲、機械噪聲、風(fēng)聲還是其他的聲音源)。期望用戶的位置在位置范圍內(nèi)。
注意,利用手持話筒圖標(biāo)來描述話筒單元,這僅僅用于示意目的,這是因為這容易支持話筒軸的描述。實際的話筒單元具有本領(lǐng)域中發(fā)現(xiàn)的任何一種結(jié)構(gòu),具有各種尺寸和形狀的單元。
圖4A與4B表示一個實施例的話音提取系統(tǒng)的兩話筒布置402。圖4A是兩話筒布置402的側(cè)視圖,而圖4B是兩話筒布置402的俯視圖。此布置402表示兩個話筒,其中這兩個話筒具有超心形檢測方向圖404,但此實施例不如此進(jìn)行限制,這是因為一個或兩個話筒能夠具有許多檢測方向圖之一或其組合,包括全向、心形或數(shù)字8檢測方向圖。間距表示為大約3.5cm。實際上,能呈現(xiàn)大致在1.0cm-10.0cm范圍內(nèi)的間距。
圖5A與5B表示一個實施例的話音提取系統(tǒng)的可替換兩話筒布置502-508。圖5A是話筒布置502-508的側(cè)視圖,而圖5B是話筒布置502-508的俯視圖。每個話筒布置502-508將話筒軸設(shè)置為與聲音傳播方向510垂直或近似垂直。還有,這四個話筒對布置502-508之中的每個布置提供一個話筒更靠近信號源599的選擇。因此,更靠近的話筒比遠(yuǎn)處的話筒更早地接收具有較大功率的話音信號,而遠(yuǎn)處話筒接收具有減弱功率的話筒信號。利用這些布置,聲音源599能夠假定沿跨越話筒502-508四周180度的弧512的寬闊范圍的位置。
圖6A與6B表示一個實施例的話音提取系統(tǒng)的另外可替換的兩話筒布置602-604。圖6A是話筒布置602-604的側(cè)視圖,而圖6B是話筒布置602-604的俯視圖。這些兩話筒布置602-604支持需要的兩個話音源698與699的近似同時的提取。在兩個話音同時有效時能獲取任何一個話音;而且,能夠同時獲取這兩個話音。
這些話筒布置602-604也將話筒軸設(shè)置為與聲音波傳播方向610垂直或幾乎垂直。還有,每個話筒對布置602-604提供第一話筒更靠近第一信號源698和第二話筒更靠近第二信號源699的選擇。這導(dǎo)致第二話筒用作第一信號源698的遠(yuǎn)處話筒,而第一話筒用作第二信號源699的遠(yuǎn)處話筒。因此,更靠近每個信號源的話筒較早接收具有較大功率的信號,而遠(yuǎn)處話筒接收具有減弱功率的信號。利用此布置602-604,聲音源612與614能夠假定沿跨越話筒602-604四周180度的每個弧612與614的寬闊范圍的位置。然而,為了獲得最佳性能,聲音源698與699應(yīng)不同時處于奇異區(qū)域616中。
圖7A與7B表示一個實施例的話音提取系統(tǒng)的還一可替換兩話筒布置702-714。圖7A是7個話筒布置702-714的側(cè)視圖,而圖7B是話筒布置702-714的俯視圖。這些話筒布置702-714將話筒軸設(shè)置為與聲音波傳播方向716平行或幾乎平行。還有,這7個話筒布置702-714之中的每個布置提供一個話筒更靠近信號源799的選擇。因此,較近的話筒較早接收具有較大功率的話音信號,而遠(yuǎn)處話筒接收具有減弱功率的話音信號。利用這些布置702-714,聲音源799能假定沿跨越話筒702-714四周大約90-120度范圍的弧718的寬闊范圍的位置。
這些話筒布置702-714還支持需要的兩個話音源的幾乎同時提取。在兩個話音同時有效時能獲取任何一個話音;而且,能夠同時獲取兩個話音。圖8是一個實施例的這些話筒布置702-714之一802的俯視圖,表示相對話筒802的源設(shè)置898與899。利用這7個布置702-714之中的任何一個布置802,一個聲音源899能假定沿跨越話筒陣列802四周大約270度的弧804的寬闊范圍的位置。將第二聲音源898限制在話筒陣列802前面跨越大約90度的弧806的位置范圍。這兩個話音源898與899之間的角度分隔能較小,而兩個話筒802之間的間距增加。
一個實施例的話音提取系統(tǒng)能夠與許多語音處理系統(tǒng)和包括但不限于手持裝置、機動車電信息通信裝置、計算機、蜂窩電話機、個人數(shù)字輔助裝置、個人通信裝置、照相機、頭盔安裝通信系統(tǒng)、助聽器和其他可攜帶聲音增強裝置、通信裝置和基于話音的命令裝置的裝置一起使用。圖9表示各種手持裝置901-910上的一個實施例的話筒陣列設(shè)置999。
圖10表示汽車電信息通信系統(tǒng)中一個實施例的話筒陣列1099布置。機動車內(nèi)的話筒陣列設(shè)置根據(jù)被獲取的信號源所占據(jù)的位置而能夠變化。還有,在機動車內(nèi)能使用多個話筒陣列,設(shè)置方向指向此機動車內(nèi)特定旅客位置。機動車內(nèi)話筒陣列位置包括但不限于支柱、遮光板裝置1002、天花板或頂部襯墊1004、頂部儀表板、后視鏡1006、擋泥板和儀表盤。能在其他的機動車類型(例如,空中客車、卡車、船和火車)中使用類似的位置。
圖11表示安裝在一對眼鏡1106或遮光板上的一個實施例的話音提取系統(tǒng)的兩話筒布置1100。此兩話筒布置1100包括話筒單元1102和1104。此話筒陣列1100能夠是助聽器的一部分,增強從佩帶眼鏡1106的人面朝的方向到達(dá)的話音信號或聲音源。
圖12表示安裝在塞繩1202上的一個實施例的話音提取系統(tǒng)的兩話筒布置1200。耳機1204將利用裝置1206播放或接收的音頻信號傳送至用戶的耳朵。兩個話筒1208與1210是至話音提取系統(tǒng)的兩個輸入,增強輸入至裝置1206的用戶的話音信號。
圖13A、B與C表示安裝在鋼筆1302或其他書寫或指示儀器上的一個實施例的話音提取系統(tǒng)的三個兩話筒布置。鋼筆1302也能是指示裝置,諸如在演示期間使用的激光指針。
圖14表示一個實施例的話音提取系統(tǒng)的許多兩話筒布置。一個布置1410包括話筒1412與1414,其軸與支持物體1416的軸垂直。另一布置1420包括話筒1422與1424,其軸與支持物體1426的軸垂直。根據(jù)支持物體相對需要的聲音源的位置來確定此布置。此支持物體包括能夠佩帶在身體1430或衣服物品1432與1434上的各種別針,但不如此進(jìn)行限制。佩帶別針的方式包括佩帶在襯衣領(lǐng)1432上、用作發(fā)夾1430和佩帶在襯衣袖口1434上,但不如此進(jìn)行限制。
兩個話筒設(shè)置準(zhǔn)則的擴展也提供許多話筒設(shè)置布置用于具有兩個以上話筒的話筒陣列。至于這兩個話筒布置,用于兩個以上話筒的布置能用于區(qū)分用戶的話音與出現(xiàn)在此環(huán)境中的所有其他聲音源之和,不管是環(huán)境噪聲、機械聲音、風(fēng)聲還是其他話音。
圖15與16表示具有兩個以上話筒的一個實施例的話筒陣列1500與1600。利用多個兩話筒單元1502與1602形成陣列1500與1600。正好位于另一話筒單元后面的話筒單元用作兩話筒單元,專用于從此陣列周圍的相關(guān)區(qū)域中發(fā)出的話音源。這些實施例1500與1600包括9個兩話筒單元,但不如此進(jìn)行限制。利用陣列1500與1600能同時從9個講話者(一個區(qū)域一個講話者)中提取話音。提取的話筒數(shù)量在保持因果律時還能夠增加到18??蛇x擇地,一組9個或更少的講話者能夠在一個區(qū)域內(nèi)或在區(qū)域之間移動。
圖17表示具有兩個以上話筒的一個實施例的可替換的話筒陣列1700。此陣列1700也通過將話筒設(shè)置在圓圈中來形成。在與此陣列的中心話筒1702配對時,陣列周邊1704上的話筒和中心1702上的話筒用作兩話筒單元1799,專用于從此陣列四周的相關(guān)區(qū)域1706中發(fā)出的話音源。然而,在此陣列中,中心話筒單元1702對于所有的兩話筒單元是公用的。此實施例包括支持8個區(qū)域1706的話筒單元1799,但不如此進(jìn)行限制。利用此陣列1700能同時進(jìn)行提取來自8個講話者(一個區(qū)域一個講話者)的話音。提取的話音數(shù)量在保持因果律時還能增加至16(每個區(qū)域兩個講話者)??蛇x擇地,一組8個或較少的講話者能夠在一個區(qū)域內(nèi)或在區(qū)域之間移動。
圖18表示具有兩個以上話筒的一個實施例的另一可替換話筒陣列1800。此陣列1800也以類似于圖17所示的布置的方式來形成,但沿此圓的話筒的軸指向遠(yuǎn)離此圓中心的方向。話筒單元1802/1804用作兩話筒單元,專用于從此陣列1800四周的相關(guān)區(qū)域1820中發(fā)出的話音信號。在此布置中,與圖17所示的布置中一樣,中心話筒單元1802對于中心話筒與周圍話筒單元形成的配對是公用的。具有如下的8個兩話筒單元對1804/1802,1806/1802,1808/1802,1810/1802,1812/1802,1814/1802,816/1802和1818/1802。此實施例使用9個單元1802、1804、1806、1808、1810、1812、1814、1816和1818來支持8個區(qū)域,但不如此進(jìn)行限制。例如,話筒單元1802/1804支持從區(qū)域1820提取話音;話筒單元1802/1808支持從區(qū)域1824提取話音;話筒單元1802/1812支持從區(qū)域1822提取話音;話筒單元1802/1816支持從區(qū)域1826提取話音,等等。因而,利用此陣列1800能夠同時提取來自8個講話者(一個區(qū)域一個講話者)的話音。提取的話音的數(shù)量在保持因果律時能增至16??蛇x擇地,一組8個或更少的講話者能夠在一個區(qū)域內(nèi)或在區(qū)域之間移動。
具有能使用陣列1800的另一方式,能夠?qū)⒃捦?804與話筒1812配對以覆蓋區(qū)域1820與1822,這不需要中心上的電話,這得到圖19A-19C所示的布置。
圖19A-C表示具有兩個以上話筒的一個實施例的其他可替換話筒陣列。布置19A-19C類似于本文所討論的其他布置,但不需要中心話筒或話筒的中央環(huán)。因此,在大多數(shù)情況中,利用此陣列能同時提取等于或少于話筒單元數(shù)量的一組話音,這是因為在使用三個布置19A-19C的大多數(shù)實際使用中,將需要的單個聲音源指定給單個話筒,而不是指定給一對話筒。
布置19A具有沿半圓弧排列的4個話筒,其軸指向遠(yuǎn)離此圓圈中心的方向。相對平坦表面安裝話筒布置19A的后側(cè)。每個話筒覆蓋此半圓的45度分段或一部分。能增加話筒的數(shù)量以得到較高分辨率。能將每個話筒單元指定為相關(guān)區(qū)域的主話筒。任何兩個或三個或所有話筒能夠用作兩或三或四輸入話音提取系統(tǒng)的輸入。如果話筒的數(shù)量為大于4的數(shù)字N,則任何兩個或三個或多個、至多N個話筒又能用作兩、三或更多、至多N輸入話音提取系統(tǒng)的輸入。布置19A能夠提取4個話音,每個區(qū)域一個話音。如果話筒的數(shù)量增至N,則能夠覆蓋N個區(qū)域,每個區(qū)域跨越180/N度,并且能夠提取N個話音。
布置19B類似于19A,但包含沿一個圓排列的8個話筒而非沿半圓排列的4個話筒。布置19B能夠覆蓋8個區(qū)域,每個區(qū)域跨越45度。
布置19C包含其軸向上指的話筒。在話筒布置必須與平坦表面齊平而沒有隆起時可以使用布置19C。一個實施例的布置19C包括能夠以55種方式配對的11個話筒和至兩輸入話音提取系統(tǒng)的輸入,這可能是提取比陣列中的話筒數(shù)量多的話音的一種方式。從N個話筒中提取的話音數(shù)量在保持因果律時還能夠增至(N)*(N-1)個話音,這是因為能夠以N*(N-1)/2種方式將N個話筒配對,并且每對能區(qū)分兩個話音。然而,尤其在一對中的兩個話筒相互靠近時,可以不使用這些配時??蛇x擇地,所有話筒能夠用作至11輸入話音提取系統(tǒng)的輸入。
具有兩個以上話筒的話筒陣列提供附加優(yōu)點,即它們對于單個用戶提供擴展范圍的位置以及同時提取多個需要話音的能力。因為這些附加話筒除去或放松對兩個話筒陣列中發(fā)現(xiàn)的話音源位置的限制,所以擴展話音源定位的范圍。
在兩話筒陣列中,期望用戶的位置在某一位置范圍內(nèi)。此范圍多少取決于使用的話筒的方向圖和特定布置。例如,在這些話筒與聲音波傳播平行定位時,得到好的話音提取性能的用戶定位范圍比在具有與聲音波傳播垂直定位的話筒的陣列中得到好性能的用戶定位范圍窄,這能夠從圖5與圖7之間的比較中推斷出。另一方面,令人不舒服的聲音源能變得更靠近需要的話音源,這通過比較圖6與圖8能夠推斷出。相反地,具有兩個以上話筒的話筒陣列允許需要的話音源位于沿包圍此話筒布置的圓弧的任何點上。
至于同時提取多個需要聲音的能力,利用兩個話筒陣列假定存在需要的單個話音源。雖然兩話筒陣列能擴展至需要的兩個話音源,但提取的質(zhì)量和效率取決于信號源的合適定位。相反地,具有兩個以上話筒單元的話筒陣列減少或消除源定位限制。
利用本文所述的兩話筒布置,對于話音提取系統(tǒng)能夠形成結(jié)構(gòu)變化。這些擴展直接轉(zhuǎn)換為改變獲得無干擾的需要話音或其他聲音或源信號的程序。還有,這些結(jié)構(gòu)變化對于其中在利用傳感器登記之前混合在一起的信號源的數(shù)量大于登記這些信號源的傳感器或傳感器單元的數(shù)量的不確定系統(tǒng)尤其有用。這些結(jié)構(gòu)擴展也可應(yīng)用于除話音信號和聲音信號之外的其他信號。在這種意義上說,信號分離結(jié)構(gòu)擴展的應(yīng)用區(qū)域具有超過話音提取的許多應(yīng)用。
從典型信號分離結(jié)構(gòu)的簡單表示中進(jìn)行擴展。圖20A表示典型的前饋信號分離結(jié)構(gòu),圖20B表示典型的反饋信號分離結(jié)構(gòu)。在這些系統(tǒng)中,M(t)是從多個傳感器登記的信號中形成的矢量。還有,Y(t)是利用輸出信號形成的矢量。在對稱結(jié)構(gòu)中,M(t)與Y(t)具有相同數(shù)量的單元。
圖21A表示接收兩個輸入并提供兩個輸出的一個實施例的話音提取結(jié)構(gòu)的方框圖。這樣的話音提取結(jié)構(gòu)和得到的方法與系統(tǒng)能夠用于在例如圖2所示的情況中獲取需要的話音。傳感器m1代表話筒1,而傳感器m2代表話筒2。在這種情況中,話音提取系統(tǒng)2102的第一輸出是提取的需要的話音信號,而第二輸出2104近似于所有干擾噪聲源之和。
圖21B表示接收兩個輸入并提供五個輸出的一個實施例的話音提取結(jié)構(gòu)的方框圖。此擴展提供計算提取的需要的話音信號的三種可替換方法。一種這樣的程序(即,方法2a)是從第二話筒(即,話筒2一提取的噪聲)減去第二輸出或提取的噪聲,這近似于語音信號或需要信號,即話筒2中的內(nèi)容。在使用此方法時,將第二話筒設(shè)置得遠(yuǎn)離講話人的嘴并因而第二話筒對于需要的源信號可能具有較低的信噪比(SNR)。在利用此方案實施的實驗中,在其中多個源干擾單個話音信號的許多情況中,利用方法2a的語音輸出提供較好的SNR。
除了從第二話筒中減去提取噪聲的濾波版本以便更精確地匹配第二話筒的噪聲分量之外,方法2b非常類似于方法2a。在許多噪聲環(huán)境中,此方法比方法2a的簡單減法方案更好地近似需要信號。與方法2b一起使用的濾波器類型能夠變化。一個示例的濾波器類型是最小均方(LMS)自適應(yīng)濾波器,但不如此進(jìn)行限制。此濾波器通過改變?yōu)V波系數(shù)最佳濾除提取的噪聲,以便最佳降低一個或多個差錯信號(諸如濾波的提取噪聲和第二話筒輸入之間的差信號)的功率(自相關(guān))。一般地,第二話筒的語音(需要信號)分量與那個話筒信號中的噪聲不相關(guān)。因此,此濾波器只用于使方法2b提取的語音輸出信號中剩余或殘余噪聲最少。
除了從第一話筒而非從第二話筒中減去濾波的提取噪聲之外,方法2c類似于方法2b。此方法具有較高的開始SNR的優(yōu)點,這是因為現(xiàn)在正在使用第一話筒,此話筒更靠近講話人的嘴。此方案的一個缺點是從第二話筒中導(dǎo)出的提取噪聲不太類似于在話筒一上發(fā)現(xiàn)的噪聲并且要求更復(fù)雜的濾波。
注意所有話筒或聲音檢測裝置具有一個或多個極性方向圖,描述這些話筒如何從各個方向接收聲音信號。圖22A-D表示在一個實施例中使用的四種類型的話筒方向圖。一個實施例的話筒陣列能夠協(xié)調(diào)許多類型和方向圖的組合,包括但不限于這四種類型。
圖22A表示全向話筒信號檢測方向圖。全向話筒幾乎相等地從此話筒四周的任何一個方向接收聲音信號。這些檢測方向圖表示從此話筒四周的所有方向幾乎相等幅度接收的信號功率。因此,自此話筒的電輸出是相同的而不管此聲音從哪個方向到達(dá)此話筒。
圖22B表示心形話筒信號檢測方向圖。腎臟形狀的心形檢測方向圖是有方向性的,在源聲音位于此話筒前面時提供全靈敏度(自此話筒的最高輸出)。在此話筒兩側(cè)(距前面±9 0度)接收的聲音大約是此輸出的一半,并且出現(xiàn)在此話筒后方(距前面180度)的聲音衰減大約70%-90%。心形方向圖話筒用于使周圍(例如,房間)聲音量相對直接聲音最小。
圖22C表示數(shù)字8話筒信號檢測方向圖。數(shù)字8檢測方向圖多少類似于背靠背設(shè)置的兩個心形方向圖。具有數(shù)字8方向圖的話筒相等地在前面與后面位置上接收聲音,同時拒絕在兩側(cè)接收的聲音。
圖22D表示超心形話筒信號檢測方向圖。超心形檢測方向圖生成來自話筒前面的全輸出和來自前面位置±90度的較低輸出,提供與心形方向圖相比較窄角度的主要靈敏度。而且,超心形方向圖在位于距前面大約±140度的兩個點處具有最低靈敏度。因此,超心形方向圖抑制從話筒兩側(cè)以及后面接收的聲音。因此,超心形方向圖最適合于從房間環(huán)境隔離出儀器和演唱者以及相互隔離儀器和演唱者。
一個實施例的話音提取系統(tǒng)的方法或技術(shù)在諸如計算機指令的機器可執(zhí)行指令中進(jìn)行實施。這些指令能夠用于使利用這些指令編程的處理器對接收的信號執(zhí)行話音提取,可選擇低,一個實施例的方法能夠利用包含適合于執(zhí)行的方法的邏輯的特定的硬件部分或利用編程的計算機部分和定制的硬件部分的任何組合來執(zhí)行。而且,一個實施例的話音提取系統(tǒng)能夠用于分布式計算環(huán)境中。
這里為了示意和說明目的而提供了本發(fā)明的各種實施例的描述,并不是將本發(fā)明限于所公開的確切形式,許多修改和等效布置將是顯而易見的。
權(quán)利要求
1.用于定位一種布置的各個接收機單元的一種方法,其中此布置包括至少兩個接收機單元,提供至少兩個輸入至信號處理系統(tǒng),此方法包括識別至少一個需要信號源的至少一個位置;確定至少一個第一接收機單元的定位;生成一組準(zhǔn)則以響應(yīng)至少一個需要信號的特征,其中此組準(zhǔn)則提供此信號處理系統(tǒng)的滿意性能;和確定至少一個附加接收機單元相對至少一個第一接收機單元的定位,以響應(yīng)此組準(zhǔn)則。
2.根據(jù)權(quán)利要求1的方法,其中此組準(zhǔn)則包括導(dǎo)致利用多于特定數(shù)量的各個接收機單元登記相同信號的接收機單元設(shè)置的不合格。
3.根據(jù)權(quán)利要求1的方法,其中此信號處理系統(tǒng)利用由至少兩個接收機單元登記的至少一個輸入信號來區(qū)分至少一個需要信號和至少一個干擾信號。
4.根據(jù)權(quán)利要求3的方法,其中此組準(zhǔn)則包括定位各個接收機單元,以使利用至少兩個接收機單元登記的干擾信號之和具有類似特征。
5.根據(jù)權(quán)利要求3的方法,其中這至少兩個接收機單元之間的間距大約在0.5英寸至5英寸范圍內(nèi)。
6.根據(jù)權(quán)利要求3的方法,其中這至少兩個接收機單元包括至少兩個話筒單元。
7.根據(jù)權(quán)利要求6的方法,其中這至少兩個話筒單元之中的每個話筒單元的主軸與自至少一個需要信號的聲音波傳播方向近似垂直。
8.根據(jù)權(quán)利要求6的方法,其中這至少兩個話筒單元之中的每個話筒單元的主軸與自至少一個需要信號的聲音波傳播方向近似平行。
9.根據(jù)權(quán)利要求6的方法,其中這至少兩個話筒單元之一的主軸與自至少一個需要信號的聲音波傳播的方向近似垂直,并且這至少兩個話筒單元之中的另一話筒單元的主軸與自至少一個需要信號的聲音波傳播方向近似平行。
10.根據(jù)權(quán)利要求1的方法,其中各個接收機單元耦合到從由計算機、監(jiān)視器、手持計算裝置、助聽器、機動車電信息通信系統(tǒng)、蜂窩電話機、個人數(shù)字輔助裝置和通信裝置構(gòu)成的一個組中選擇的至少一個裝置。
11.根據(jù)權(quán)利要求1的方法,其中耦合到機動車電信息通信系統(tǒng)的各個接收機單元位于從由支柱、遮光板、頂部襯墊、頂部儀表板、后視鏡、擋泥板和儀表盤構(gòu)成的一個組中選擇的至少一個機動車組成部分中。
12.根據(jù)權(quán)利要求1的方法,其中各個接收機單元定位于從由鋼筆、書寫儀器、音頻播放與記錄裝置、收聽裝置、耳機、耳塞、衣服物品、眼鏡、頭飾、表、手鐲、耳環(huán)、珠寶、能夠穿戴在身體上的物品和能夠穿戴在衣服物品上的物品構(gòu)成的一個組中選擇的至少一個物品上。
13.根據(jù)權(quán)利要求1的方法,其中各個接收機單元耦合到插入在耳道中的裝置。
14.用于定位信號處理系統(tǒng)的接收機陣列的一種方法,包括識別至少一個需要信號源的至少一個位置;確定接收機陣列的至少一個第一接收機單元相對至少一個位置的定位,其中至少一個第一接收機單元在第一時間接收至少一個需要信號;和確定接收機陣列的至少一個第二接收機單元相對至少一個第一接收機單元的定位,其中至少一個第二接收機單元第二時間接收至少一個需要信號,其中至少一個第一與第二接收機單元之間的間距提供至少一個時間延遲,此時間延遲支持至少一個需要信號與干擾源之和的多個線性組合的生成以及干擾源之和的登記,以使第一和類似于第二和。
15.根據(jù)權(quán)利要求14的方法,其中此間距支持對至少一個接收信號的多個延遲版本執(zhí)行信號提取。
16.根據(jù)權(quán)利要求14的方法,其中至少一個第一接收機單元包括至少一個第一話筒,而至少一個第二接收機單元包括至少一個第二話筒。
17.根據(jù)權(quán)利要求16的方法,還包括在至少一個第一話筒和至少一個第二話筒之中的每一個話筒中利用至少一個話筒之間的信號幅度差異來隔離至少一個需要信號。
18.根據(jù)權(quán)利要求14的方法,還包括至少一個第一接收機單元和至少一個第二接收機單元對應(yīng)于多個信號源之中的每一個信號源。
19.根據(jù)權(quán)利要求14的方法,還包括至少一個第一接收機單元對應(yīng)于多個信號源之中的每一個信號源,其中至少一個第二接收機單元包括這多個信號源公用的至少一個話筒單元。
20.根據(jù)權(quán)利要求14的方法,其中至少一個第一接收機單元在第一時間從第一信號源中接收至少一個信號并在第二時間從第二信號源中接收至少一個信號,其中至少一個第二接收機單元在第一時間從第二信號源中接收至少一個信號并在第二時間從第一信號源中接收至少一個信號。
21.用于從組合音頻信號中提取至少一個需要信號的一種方法,包括識別至少一個需要信號源的至少一個位置;確定話筒布置的至少一個第一話筒單元相對至少一個位置的定位;生成一組準(zhǔn)則以響應(yīng)此組合音頻信號的特征,其中此組準(zhǔn)則從此組合音頻信號中提供令人滿意的需要信號的提??;和確定此話筒布置的至少一個附加話筒單元相對至少一個第一話筒單元的定位,以響應(yīng)此組準(zhǔn)則。
22.根據(jù)權(quán)利要求21的方法,其中此組準(zhǔn)則利用第二組準(zhǔn)則來替代,其中第二組準(zhǔn)則用于從此組合音頻信號中滿意除去需要信號。
23.根據(jù)權(quán)利要求22的方法,其中此組準(zhǔn)則利用第二組準(zhǔn)則來補充。
24.根據(jù)權(quán)利要求21的方法,其中此組準(zhǔn)則包括在信號提取期間保持因果律。
25.根據(jù)權(quán)利要求24的方法,還包括通過延遲利用此話筒布置的至少一個話筒單元登記的至少一個輸入信號來保持因果律。
26.用于從組合音頻信號中提取至少一個需要信號的一種方法,包括確定接收機陣列的至少一個第一接收機單元相對至少一個需要信號源的至少一個位置的定位,其中至少一個第一接收機單元在第一時間接收至少一個需要信號;確定接收機陣列的至少一個第二接收機單元相對至少一個第一接收機單元的定位,其中至少一個第二接收機單元在第二時間接收至少一個需要信號,其中至少一個第一與第二接收機單元之間的間距允許至少一個源信號與干擾信號源之和的多個線性組合的生成以及干擾信號源之和的登記,以使第一和類似于第二和;利用接收機陣列來接收此組合音頻信號;和利用至少一個接收機單元之間的信號幅度差異來提取至少一個需要信號。
27.根據(jù)權(quán)利要求26的方法,其中此間距支持對至少一個接收信號的多個延遲版本執(zhí)行信號提取。
28.根據(jù)權(quán)利要求26的方法,還包括至少一個第一接收機單元對應(yīng)于多個信號源之中的每一個信號源,其中至少一個第二接收機單元包括這多個信號源公用的一個話筒單元。
29.用于與語音處理系統(tǒng)一起使用的一種話筒陣列,包括至少一個第一話筒單元,定位于在第一時間從至少一個信號源中接收至少一個需要信號;至少一個第二話筒單元,定位于相對至少一個第一話筒單元在第二時間接收至少一個需要信號,其中至少一個第一與第二話筒單元之間的間距允許生成至少一個源信號與干擾信號源之和的多個組合。
30.根據(jù)權(quán)利要求29的話筒陣列,其中此間距支持干擾源之和的登記,以使利用至少一個話筒單元登記的和類似于利用至少一個其他話筒單元登記的和。
31.根據(jù)權(quán)利要求29的話筒陣列,其中至少兩個話筒單元在未知時間接收至少一個需要信號,其中在信號處理之前對至少一個接收的話筒信號引入延遲。
32.根據(jù)權(quán)利要求31的話筒陣列,其中對第一話筒單元的接收信號施加第一長度的延遲,并對第二話筒單元的接收信號施加第二長度的延遲。
33.根據(jù)權(quán)利要求29的陣列,其中此間距大約在0.5英寸至5英寸范圍內(nèi)。
34.根據(jù)權(quán)利要求29的話筒陣列,還包括至少一個第一話筒單元和至少一個第二話筒單元,每個話筒單元對應(yīng)于一組需要信號源之中的一個信號源。
35.根據(jù)權(quán)利要求29的話筒陣列,還包括至少一對話筒單元,其中每對話筒單元對應(yīng)于至少一個需要信號源。
36.根據(jù)權(quán)利要求29的話筒陣列,其中至少一個話筒單元對于至少兩個話筒對是公用的。
37.根據(jù)權(quán)利要求29的話筒,還包括對應(yīng)于多個信號源之中的每一個信號源的至少一個第一話筒單元,其中至少一個第二話筒單元包括這多個信號源公用的一個話筒單元。
38.根據(jù)權(quán)利要求29的話筒陣列,其中此話筒陣列耦合到從由手持計算裝置、助聽器、機動車電信息通信系統(tǒng)、蜂窩電話機、個人數(shù)字輔助裝置和通信裝置構(gòu)成的一個組中選擇的至少一個裝置。
39.根據(jù)權(quán)利要求28的話筒陣列,其中耦合到機動車電信息通信系統(tǒng)的話筒陣列位于從由支柱、遮光板、頂部襯墊、頂部儀表板、后視鏡、擋泥板和儀表盤構(gòu)成的一個組中選擇的至少一個機動車組成部分中。
40.根據(jù)權(quán)利要求29的方法,其中此話筒陣列位于從由鋼筆、書寫儀器、音頻播放與記錄裝置、收聽裝置、耳機、耳塞、衣服物品、眼鏡、頭飾、表、手鐲、耳環(huán)、珠寶、能夠穿戴在身體上的物品和能夠穿戴在衣服物品上的物品構(gòu)成的一個組中選擇的至少一個物品上。
41.一種音頻信號處理系統(tǒng),包括至少一個信號處理器;至少一個話筒陣列,耦合在至少一個環(huán)境與至少一個信號處理器之間,其中至少一個信號處理器從組合音頻信號中提取至少一個需要信號。
42.一種音頻信號處理系統(tǒng),包括至少一個信號處理器;至少一個話筒陣列,耦合在至少一個環(huán)境與至少一個信號處理器之間,其中至少一個話筒陣列包括至少一個第一話筒單元,定位于在至少一個環(huán)境中按時從至少一個信號源接收至少一個需要信號;至少一個第二話筒單元,定位于相對至少一個第一話筒單元在第二時間接收至少一個需要信號,其中至少一個第一與第二話筒單元之間的間距允許至少一個源信號與干擾源之和的多個組合的生成以及干擾源之和的登記,以使第一和類似于第二和。
43.用于利用至少兩個話筒單元從組合音頻信號中提取至少一個需要信號的一種方法,每個話筒單元對應(yīng)于輸入信道,此方法包括在至少兩個輸出信道之間分配至少一個輸入信道的內(nèi)容,其中至少兩個輸出信道之中的至少一個輸出信道包括比至少一個輸入信道高的至少一個需要信號的比例。
44.根據(jù)權(quán)利要求43的方法,其中至少一個輸出信道包含比至少一個輸入信道低的至少一個需要信號的比例。
45.根據(jù)權(quán)利要求43的方法,其中分配包括至少一個盲信號分隔方法。
46.根據(jù)權(quán)利要求43的方法,其中使用的許多輸入信道變化,以響應(yīng)至少一個輸入信道的特征。
47.根據(jù)權(quán)利要求43的方法,其中使用的許多輸出信道變化,以響應(yīng)至少一個輸入信道或至少一個輸出信道的特征。
48.根據(jù)權(quán)利要求43的方法,其中分配包括至少一個輸入信道和至少一個其他輸入信道之間的至少一個操作。
49.根據(jù)權(quán)利要求43的方法,其中分配包括多個輸出信道之間的至少一個操作。
50.根據(jù)權(quán)利要求43的方法,其中分配包括至少一個輸入信道與至少一個輸出信道之間的至少一個操作。
51.一種計算機可讀介質(zhì),具有可執(zhí)行指令,這些指令在處理系統(tǒng)中執(zhí)行時提供信號處理系統(tǒng)的接收機布置的定位信息,此定位信息包括識別至少一個需要信號源的至少一個位置;確定至少一個第一接收機單元的定位;生成一組準(zhǔn)則以響應(yīng)至少一個需要信號的特征,其中此組準(zhǔn)則提供此信號處理系統(tǒng)的滿意性能;和確定至少一個附加接收機單元相對至少一個第一接收機單元的定位,以響應(yīng)此組準(zhǔn)則。
52.一種計算機可讀介質(zhì),具有可執(zhí)行指令,這些指令在處理系統(tǒng)中執(zhí)行時提供信號處理系統(tǒng)的接收機陣列的定位信息,此定位信息包括識別至少一個需要信號源的至少一個位置;確定接收機陣列的至少一個第一接收機單元相對至少一個位置的定位,其中至少一個第一接收機單元在第一時間接收至少一個需要信號;和確定接收機陣列的至少一個第二接收機單元相對至少一個第一接收機單元的定位,其中至少一個第二接收機單元在第二時間接收至少一個需要信號,其中至少一個第一與第二接收機單元之間的間距提供至少一個時間延遲,此時間延遲支持至少一個需要信號與干擾源之和的多個線性組合的生成以及干擾源之和的登記,以使第一和類似于第二和。
53.一種計算機可讀介質(zhì),具有可執(zhí)行指令,這些指令在處理系統(tǒng)中執(zhí)行時隔離至少一個需要信號和組合音頻信號,此隔離包括確定接收機陣列的至少一個第一接收機單元相對至少一個需要信號源的至少一個位置的定位,其中至少一個第一接收機單元在第一時間接收至少一個需要信號;確定接收機陣列的至少一個第二接收機單元相對至少一個第一接收機單元的定位,其中至少一個第二接收機單元在第二時間接收至少一個需要信號,其中至少一個第一與第二接收機單元之間的間距允許至少一個源信號與干擾源之和的多個線性組合的生成以及干擾源之和的登記,以使第一和類似于第二和;利用此接收機陣列接收組合音頻信號;和利用至少一個接收機單元之間的信號幅度差異來隔離至少一個需要信號。
54.一種計算機可讀介質(zhì),具有可執(zhí)行指令,這些指令在處理系統(tǒng)中執(zhí)行時隔離至少一個需要信號和組合音頻信號,此隔離包括將至少兩個話筒單元耦合到至少一個輸入信道;和在至少兩個輸出信道之間分配至少一個輸入信道的內(nèi)容,其中至少一個輸出信道包括比至少一個輸入信道高的至少一個需要信號的比例。
55.根據(jù)權(quán)利要求54的計算機可讀介質(zhì),其中至少一個輸出信道具有比至少一個輸入信道低的至少一個需要信號的比例。
56.根據(jù)權(quán)利要求54的計算機可讀介質(zhì),還包括確定至少一個需要信號源的至少一個位置相對話筒布置的至少一個話筒單元的近似定位。
57.一種計算機可讀介質(zhì),具有可執(zhí)行指令,這些指令在處理系統(tǒng)中執(zhí)行時提供信號處理系統(tǒng)的接收機布置的定位信息,此定位信息包括識別至少一個需要信號源的至少一個位置;確定至少一個第一接收機單元的定位;生成一組準(zhǔn)則,以響應(yīng)至少一個需要信號的特征,其中此組準(zhǔn)則提供信號處理系統(tǒng)的滿意性能;和確定至少一個附加第一接收機單元相對至少一個第一接收機單元的定位,以響應(yīng)此組準(zhǔn)則。
全文摘要
提供用于定位具有至少兩個單元的話筒布置的各個單元的一種方法。話筒單元之間的間距支持需要信號與干擾源之和的許多組合的生成。話筒單元設(shè)置方法的使用導(dǎo)致形成許多類型的具有至少兩個話筒單元的話筒布置,并提供輸入數(shù)據(jù)給信號處理系統(tǒng)進(jìn)行聲音鑒別。提供這些話筒布置的許多示例,其中一些示例與日常物體組合。也增強和擴展基于信號分離的處理系統(tǒng)通過將這些話筒布置用作傳感器前端來進(jìn)行聲音鑒別。
文檔編號H04R1/40GK1436436SQ01810581
公開日2003年8月13日 申請日期2001年3月30日 優(yōu)先權(quán)日2000年3月31日
發(fā)明者G·埃爾滕 申請人:克拉里提有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1