日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種語音信號處理方法、裝置及電子設(shè)備與流程

文檔序號:11232687閱讀:788來源:國知局
一種語音信號處理方法、裝置及電子設(shè)備與流程

本發(fā)明涉及語音信號處理技術(shù)領(lǐng)域,特別是涉及一種語音信號處理方法、裝置及電子設(shè)備。



背景技術(shù):

目前,市場上有越來越多的產(chǎn)品具有語音交互功能,例如智能音箱、機器人等電子設(shè)備。這些電子設(shè)備在接收到喚醒指令后,從待機狀態(tài)切換至工作狀態(tài),并通過麥克風陣列接收語音信號,即進行拾音,進而可以對該語音信號進行識別和解析,從而響應(yīng)該語音信號對應(yīng)的交互指令。

上述具有語音交互功能的電子設(shè)備在接收到喚醒指令后,通過麥克風陣列接收周圍環(huán)境中的各聲源發(fā)出的語音信號,將這些語音信號中音量最大者對應(yīng)的聲源方位識別為用戶聲源方位,聲音最大的語音信號也即被視為用戶發(fā)出的語音信號,進而響應(yīng)該語音信號對應(yīng)的交互指令。

通常情況下,應(yīng)用上述方式能夠較佳的進行語音信號處理,但是如果用戶周圍存在一個或多個音量大于用戶音量的發(fā)聲對象,那么該具有語音交互功能的電子設(shè)備便會將接收到的語音信號中音量最大者對應(yīng)的聲源方位識別為用戶聲源方位,并對音量最大的語音信號進行識別和解析得到交互指令,進而會進行錯誤的響應(yīng),導致用戶體驗不佳。



技術(shù)實現(xiàn)要素:

本發(fā)明實施例公開了一種語音信號處理方法、裝置及電子設(shè)備,用以避免響應(yīng)錯誤,提升用戶體驗。技術(shù)方案如下:

第一方面,本發(fā)明實施例提供了一種語音信號處理方法,應(yīng)用于具有語音交互功能的電子設(shè)備,所述方法包括:

在所述電子設(shè)備處于睡眠狀態(tài)情況下,接收語音信號,并判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令;

若為是,由睡眠狀態(tài)切換至工作狀態(tài),并定位所接收到的語音信號的聲源方位為用戶聲源方位;

繼續(xù)接收語音信號,并對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號;

響應(yīng)所述用戶語音信號對應(yīng)的交互指令。

可選的,所述對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號的步驟,包括:

對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位以外的語音信號進行噪聲抑制處理,并對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位的語音信息號進行波束增強處理,獲得所述用戶語音信號。

可選的,所述方法還包括:

按照所述用戶聲源方位指示用戶方位。

可選的,所述方法還包括:

判斷從所述用戶聲源方位接收到的語音信號對應(yīng)的交互指令是否為聲源定位方式轉(zhuǎn)換指令;

若為是,繼續(xù)接收語音信號,將所接收到的語音信號中音量最大者對應(yīng)的聲源方位確定為用戶聲源方位,并將所接收到的語音信號中音量最大者確定為用戶語音信號,響應(yīng)所述用戶語音信號對應(yīng)的交互指令。

可選的,所述判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令的步驟,包括:

按照以下方式判斷所接收的每一語音信號對應(yīng)的交互指令是否為喚醒指令:

對目標語音信號進行過濾處理,濾除所述目標語音信號中頻率屬于預設(shè)頻率段的語音信號,其中,所述目標語音信號為:所接收的一個語音信號;

判斷過濾處理后的目標語音信號對應(yīng)的交互指令是否為喚醒指令。

可選的,所述定位所接收到的語音信號的聲源方位為用戶聲源方位的步驟,包括:

定位并記錄所接收到的語音信號的聲源方位,作為第二類聲源方位;

根據(jù)第一類聲源方位和所述第二類聲源方位定位用戶聲源方位,其中,所述第一類聲源方位為所述電子設(shè)備處于睡眠狀態(tài)的情況下,定位并記錄的所接收到的語音信號的聲源方位,該語音信號對應(yīng)的交互指令不為喚醒指令。

可選的,所述根據(jù)第一類聲源方位和所述第二類聲源方位定位用戶聲源方位的步驟,包括:

判斷所述第二類聲源方位中是否存在不屬于所述第一類聲源方位的聲源方位;

若為是,將所述第二類聲源方位中不屬于所述第一類聲源方位的聲源方位定位為用戶聲源方位。

可選的,所述將所述第二類聲源方位中不屬于所述第一類聲源方位的聲源方位定位為用戶聲源方位的步驟,包括:

確定所述第二類聲源方位中不屬于第一類聲源方位的聲源方位的數(shù)量;

當所確定的數(shù)量大于1時,將不屬于預設(shè)頻率段的語音信號對應(yīng)的聲源方位,確定為所述用戶聲源方位。

可選的,所述將不屬于所述預設(shè)頻率段的語音信號對應(yīng)的聲源方位,確定為所述用戶聲源方位的步驟,包括:

確定不屬于所述預設(shè)頻率段的語音信號對應(yīng)的聲源方位的數(shù)量;

當所確定的數(shù)量大于1時,將所述不屬于所述預設(shè)頻率段的語音信號中,波形與預設(shè)波形的相似度大于第一預設(shè)值的語音信號對應(yīng)的聲源方位確定為所述用戶聲源方位。

可選的,在所述第二類聲源方位均屬于所述第一類聲源方位的情況下,所述方法還包括:

判斷處于同一聲源方位的第一語音信號與第二語音信號的能量差值是否大于第二預設(shè)值,其中,所述第一語音信號為所述電子設(shè)備處于睡眠狀態(tài)時接收到的語音信號,所述第二語音信號為所述電子設(shè)備處于工作狀態(tài)時接收到的語音信號;

如果是,將該第二語音信號對應(yīng)的第二類聲源方位確定為所述用戶聲源方位。

可選的,在所述第二類聲源方位均屬于所述第一類聲源方位的情況下,所述方法還包括:

將所述第二類聲源方位中,波形與預設(shè)波形的相似度大于第一預設(shè)值的語音信號對應(yīng)的聲源方位確定為所述用戶聲源方位。

可選的,所述將所述第二類聲源方位中不屬于所述第一類聲源方位的聲源方位定位為用戶聲源方位的步驟,包括:

確定所述第二類聲源方位中不屬于所述第一類聲源方位的聲源方位為目標聲源方位;

根據(jù)所述目標聲源方位,確定目標范圍[a,b],并將所述目標范圍內(nèi)的聲源方位確定為所述用戶聲源方位,其中,a為所述目標聲源方位與第一預設(shè)方位差值的差值,b為所述目標聲源方位與第二預設(shè)方位差值的加和。

第二方面,本發(fā)明實施例還提供了一種語音信號處理裝置,應(yīng)用于具有語音交互功能的電子設(shè)備,所述裝置包括:

喚醒指令判斷模塊,用于在所述電子設(shè)備處于睡眠狀態(tài)情況下,接收語音信號,并判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令;

聲源定位模塊,用于在所接收到的語音信號對應(yīng)的交互指令為喚醒指令的情況下,由睡眠狀態(tài)切換至工作狀態(tài),并定位所接收到的語音信號的聲源方位為用戶聲源方位;

用戶語音信號獲得模塊,用于繼續(xù)接收語音信號,并對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號;

第一交互指令響應(yīng)模塊,用于響應(yīng)所述用戶語音信號對應(yīng)的交互指令。

可選的,所述用戶語音信號獲得模塊包括:

用戶語音信號獲得子模塊,用于對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位以外的語音信號進行噪聲抑制處理,并對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位的語音信息號進行波束增強處理,獲得所述用戶語音信號。

可選的,所述裝置還包括:

用戶方位指示模塊,用于按照所述用戶聲源方位指示用戶方位。

可選的,所述裝置還包括:

轉(zhuǎn)換指令判斷模塊,用于判斷從所述用戶聲源方位接收到的語音信號對應(yīng)的交互指令是否為聲源定位方式轉(zhuǎn)換指令;

第二交互指令響應(yīng)模塊,用于在從所述用戶聲源方位接收到的語音信號對應(yīng)的交互指令為聲源定位方式轉(zhuǎn)換指令的情況下,繼續(xù)接收語音信號,將所接收到的語音信號中音量最大者對應(yīng)的聲源方位確定為用戶聲源方位,并將所接收到的語音信號中音量最大者確定為用戶語音信號,響應(yīng)所述用戶語音信號對應(yīng)的交互指令。

可選的,所述喚醒指令判斷模塊包括:

信號過濾子模塊和指令判斷子模塊;

所述喚醒指令判斷模塊,具體用于通過所述信號過濾子模塊和指令判斷子模塊判斷所接收的每一語音信號對應(yīng)的交互指令是否為喚醒指令;

所述信號過濾子模塊,用于對目標語音信號進行過濾處理,濾除所述目標語音信號中頻率屬于預設(shè)頻率段的語音信號,其中,所述目標語音信號為:所接收的一個語音信號;

所述指令判斷子模塊,用于判斷過濾處理后的目標語音信號對應(yīng)的交互指令是否為喚醒指令。

可選的,所述聲源定位模塊包括:

聲源定位子模塊,用于定位并記錄所接收到的語音信號的聲源方位,作為第二類聲源方位;

用戶聲源方位確定子模塊,用于根據(jù)第一類聲源方位和所述第二類聲源方位定位用戶聲源方位,其中,所述第一類聲源方位為所述電子設(shè)備處于睡眠狀態(tài)的情況下,定位并記錄的所接收到的語音信號的聲源方位,該語音信號對應(yīng)的交互指令不為喚醒指令。

可選的,所述用戶聲源方位確定子模塊包括:

判斷單元,用于判斷所述第二類聲源方位中是否存在不屬于所述第一類聲源方位的聲源方位;

用戶聲源方位確定單元,用于在所述第二類聲源方位中存在不屬于所述第一類聲源方位的聲源方位的情況下,將所述第二類聲源方位中不屬于所述第一類聲源方位的聲源方位定位為用戶聲源方位。

可選的,所述用戶聲源方位確定單元包括:

數(shù)量確定子單元,用于確定所述第二類聲源方位中不屬于第一類聲源方位的聲源方位的數(shù)量;

第一方位確定子單元,用于當所確定的數(shù)量大于1時,將不屬于預設(shè)頻率段的語音信號對應(yīng)的聲源方位,確定為所述用戶聲源方位。

可選的,所述第一方位確定子單元,具體用于確定不屬于所述預設(shè)頻率段的語音信號對應(yīng)的聲源方位的數(shù)量;當所確定的數(shù)量大于1時,將所述不屬于所述預設(shè)頻率段的語音信號中,波形與預設(shè)波形的相似度大于第一預設(shè)值的語音信號對應(yīng)的聲源方位確定為所述用戶聲源方位。

可選的,所述裝置還包括:

能量差值判斷模塊,用于在所述第二類聲源方位均屬于所述第一類聲源方位的情況下,判斷處于同一聲源方位的第一語音信號與第二語音信號的能量差值是否大于第二預設(shè)值,其中,所述第一語音信號為所述電子設(shè)備處于睡眠狀態(tài)時接收到的語音信號,所述第二語音信號為所述電子設(shè)備處于工作狀態(tài)時接收到的語音信號;如果是,將該第二語音信號對應(yīng)的第二類聲源方位確定為所述用戶聲源方位。

可選的,所述裝置還包括:

波形比較模塊,用于將所述第二類聲源方位中,波形與預設(shè)波形的相似度大于第一預設(shè)值的語音信號對應(yīng)的聲源方位確定為所述用戶聲源方位。

可選的,所述用戶聲源方位確定子模塊包括:

目標聲源方位確定單元,用于確定所述第二類聲源方位中不屬于所述第一類聲源方位的聲源方位為目標聲源方位;

第二方位確定單元,用于根據(jù)所述目標聲源方位,確定目標范圍[a,b],并將所述目標范圍內(nèi)的聲源方位確定為所述用戶聲源方位,其中,a為所述目標聲源方位與第一預設(shè)方位差值的差值,b為所述目標聲源方位與第二預設(shè)方位差值的加和。

第三方面,本發(fā)明實施例還提供了一種電子設(shè)備,所述電子設(shè)備包括:殼體、處理器、存儲器、電路板和電源電路,其中,電路板安置在殼體圍成的空間內(nèi)部,處理器和存儲器設(shè)置在電路板上;電源電路,用于為電子設(shè)備的各個電路或器件供電;存儲器用于存儲可執(zhí)行程序代碼;處理器通過讀取存儲器中存儲的可執(zhí)行程序代碼來運行與可執(zhí)行程序代碼對應(yīng)的程序,以用于執(zhí)行上述的語音信號處理方法。

本發(fā)明實施例所提供的方案中,具有語音交互功能的電子設(shè)備在處于睡眠狀態(tài)情況下,接收語音信號,并判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令,若為是,由睡眠狀態(tài)切換至工作狀態(tài),并定位所接收到的語音信號的聲源方位為用戶聲源方位,然后繼續(xù)接收語音信號,并對繼續(xù)接收到的語音信號中來源于用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號,進而響應(yīng)用戶語音信號對應(yīng)的交互指令。電子設(shè)備將喚醒指令所對應(yīng)的聲源方位確定為用戶聲源方位,并對繼續(xù)接收到的語音信號中該方位以外的語音信號進行噪聲抑制處理,獲得的用戶語音信號即為處于用戶聲源方位的用戶發(fā)出的語音信號,因此可以進行正確的響應(yīng),提升用戶體驗。

附圖說明

為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本發(fā)明實施例所提供的一種語音信號處理方法的流程圖;

圖2為本發(fā)明實施例所提供的一種語音信號處理裝置的結(jié)構(gòu)示意圖;

圖3為本發(fā)明實施例所提供的一種電子設(shè)備的結(jié)構(gòu)示意圖。

具體實施方式

下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。

為了避免響應(yīng)錯誤,提升用戶體驗,本發(fā)明實施例提供了一種語音信號處理方法、裝置及電子設(shè)備。

下面首先對本發(fā)明實施例所提供的一種語音信號處理方法進行介紹。

首先需要說明的是,本發(fā)明實施例所提供的一種語音信號處理方法可以應(yīng)用于具有語音交互功能的電子設(shè)備(以下簡稱電子設(shè)備),例如,智能音箱、機器人等。該電子設(shè)備一般具有麥克風陣列,或與麥克風陣列建立通信連接,該通信連接可以為有線連接或無線連接,其中,無線連接可以為wifi連接、藍牙連接等。該麥克風陣列用于接收語音信號。

如圖1所示,一種語音信號處理方法,應(yīng)用于具有語音交互功能的電子設(shè)備,所述方法包括:

s101,在所述電子設(shè)備處于睡眠狀態(tài)情況下,接收語音信號,并判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令,若為是,執(zhí)行步驟s102;

從一定角度來講,電子設(shè)備的狀態(tài)可以劃分為:睡眠狀態(tài)和工作狀態(tài),當電子設(shè)備處于睡眠狀態(tài)時,需通過接收喚醒指令喚醒電子設(shè)備,進而切換至工作狀態(tài)。另外,當電子設(shè)備處于睡眠狀態(tài)時,依然可以持續(xù)接收周圍環(huán)境中的聲源發(fā)出的語音信號,也就是,電子設(shè)備處于睡眠狀態(tài)時,麥克風陣列依然工作。此時該電子設(shè)備可以接收語音信號,以確定是否接收到喚醒指令。

電子設(shè)備接收到一段語音信號后,即開始對接收到的這一段語音信號進行語音識別,判斷所接收的這一段語音信號對應(yīng)的交互指令是否為喚醒指令。具體的,如果這一段語音信號的語音識別結(jié)果中包括預設(shè)的喚醒詞,那么該段語音信號對應(yīng)的交互指令即為喚醒指令。也就是說,電子設(shè)備接收到語音信號后,可以對該語音信號進行語音識別,得到語音識別結(jié)果,進而便可以判斷出該語音信號的語音識別結(jié)果中是否包括預設(shè)的喚醒詞。

需要說明的是,電子設(shè)備接收到語音信號后,可以在本地進行語音信號的語音識別,得到語音識別結(jié)果,也可以將該語音信號發(fā)送至服務(wù)器,服務(wù)器接收到該語音信號后,便可以對該語音信號進行語音識別,得到語音識別結(jié)果,并將語音識別結(jié)果發(fā)送至電子設(shè)備,電子設(shè)備也就能獲得該語音識別結(jié)果,進而,便可以判斷該語音信號的語音識別結(jié)果中是否包括預設(shè)的喚醒詞。

舉例而言,如果預設(shè)的喚醒詞為“小雅”,那么如果電子設(shè)備接收到的語音信號對應(yīng)的語音識別結(jié)果中包括“小雅”兩個字,那么該語音信號對應(yīng)的交互指令即為喚醒指令;如果電子設(shè)備接收到的語音信號對應(yīng)的語音識別結(jié)果中是不包括“小雅”兩個字的其他語句,或者是不具有任何語義的語音信號,例如空調(diào)發(fā)出的語音信號,那么該語音信號對應(yīng)的交互指令便不是喚醒指令。

s102,由睡眠狀態(tài)切換至工作狀態(tài),并定位所接收到的語音信號的聲源方位為用戶聲源方位;

電子設(shè)備判斷出所接收到的語音信號對應(yīng)的交互指令為喚醒指令時,說明此時用戶發(fā)出了語音信號來喚醒電子設(shè)備,以使電子設(shè)備可以與用戶進行語音交互,實現(xiàn)功能,電子設(shè)備便需要由睡眠狀態(tài)切換至工作狀態(tài)。

與此同時,電子設(shè)備可以定位所接收到的語音信號的聲源方位,將該聲源方位確定為用戶聲源方位。需要說明的是,語音信號的聲源方位的定位方式可以采用時延預估法等聲源定位方式,也就是說,可以根據(jù)語音信號到達麥克風陣列中各麥克風處的時間來定位語音信號的聲源方位,在此不做具體限定及說明。

可以理解的是,如果電子設(shè)備判斷出所接收到的語音信號所對應(yīng)的交互指令不是喚醒指令時,那么便不會轉(zhuǎn)換至工作狀態(tài),而是在睡眠狀態(tài)下繼續(xù)接收語音信號,并繼續(xù)判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令。

s103,繼續(xù)接收語音信號,并對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號;

確定了用戶聲源方位后,由于用戶一般會繼續(xù)發(fā)出語音信號,所以電子設(shè)備可以繼續(xù)接收語音信號,并對繼續(xù)接收到的語音信號中來源于用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號。

可以理解的是,由于用戶聲源方位以外的其他方位也可能存在聲源,即噪聲聲源,這些噪聲聲源也可能會發(fā)出語音信號,電子設(shè)備也就會接收到這些噪聲聲源發(fā)出的語音信號,為了可以更好地接收用戶所發(fā)出的語音信號,也就是來源于用戶聲源方位的語音信號,電子設(shè)備可以對來源于用戶聲源方位以外的語音信號進行噪聲抑制處理,以減弱來源于用戶聲源方位以外的語音信號的能量,進而獲得用戶語音信號。

需要說明的是,上述噪聲抑制處理可以采用現(xiàn)有的任意噪聲抑制處理方式,例如可以為端點檢測、噪聲分離、頻譜過濾等方式,只要能夠達到將語音信號的能量進行減弱的目的即可,在此不做具體限定。

s104,響應(yīng)所述用戶語音信號對應(yīng)的交互指令。

獲得了用戶語音信號后,電子設(shè)備便可以響應(yīng)該用戶語音信號對應(yīng)的交互指令。電子設(shè)備可以通過語音播放等多種形式響應(yīng)該交互指令,如果電子設(shè)備具有顯示屏幕,那么也可以通過顯示屏幕響應(yīng)該交互指令,這都是合理的。

舉例而言,如果用戶語音信號對應(yīng)的交互指令為播放某音樂,那么電子設(shè)備便可以獲取本地保存的音樂資源,或者向服務(wù)器請求該音樂資源,進而進行播放。如果用戶語音信號對應(yīng)的交互指令為詢問今天天氣情況,那么電子設(shè)備便可以向服務(wù)器請求天氣資源,進而用語音播放等形式將天氣情況告知用戶,進而完成交互指令的響應(yīng)。

可見,本發(fā)明實施例所提供的方案中,具有語音交互功能的電子設(shè)備在處于睡眠狀態(tài)情況下,接收語音信號,并判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令,若為是,由睡眠狀態(tài)切換至工作狀態(tài),并定位所接收到的語音信號的聲源方位為用戶聲源方位,然后繼續(xù)接收語音信號,并對繼續(xù)接收到的語音信號中來源于用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號,進而響應(yīng)用戶語音信號對應(yīng)的交互指令。電子設(shè)備將喚醒指令所對應(yīng)的聲源方位確定為用戶聲源方位,并對繼續(xù)接收到的語音信號中該方位以外的語音信號進行噪聲抑制處理,獲得的用戶語音信號即為處于用戶聲源方位的用戶發(fā)出的語音信號,因此可以進行正確的響應(yīng),提升用戶體驗。

作為本發(fā)明實施例的一種實施方式,所述對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號的步驟,可以包括:

對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位以外的語音信號進行噪聲抑制處理,并對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位的語音信息號進行波束增強處理,獲得所述用戶語音信號。

為了使獲得的用戶語音信號更強,以便電子設(shè)備更準確地響應(yīng)用戶語音信號對應(yīng)的交互指令,電子設(shè)備在對繼續(xù)接收到的語音信號中來源于用戶聲源方位以外的語音信號進行噪聲抑制處理的同時,還可以對繼續(xù)接收到的語音信號中來源于用戶聲源方位的語音信息號進行波束增強處理,以增加來源于用戶聲源方位的語音信號的能量,這樣電子設(shè)備可以將波束增強處理后的語音信號作為用戶語音信號,對該用戶語音信號進行更準確地識別及解析,得到正確的交互指令,進而,正確地響應(yīng)該交互指令。

需要說明的是,上述波束增強處理可以采用現(xiàn)有的任意波束增強處理方式,例如可以為語音提取分離、對角加載算法、自適應(yīng)波速形成等方式,只要能夠達到將語音信號的能量進行增強的目的即可,在此不做具體限定。

作為本發(fā)明實施例的一種實施方式,上述方法還可以包括:

按照所述用戶聲源方位指示用戶方位。

為了方便用戶查看當前用戶聲源方位,電子設(shè)備可以按照用戶聲源方位指示用戶方位。在一種實施方式中,電子設(shè)備可以采用指示燈的方式指示用戶方位,例如,用戶聲源方位為45度方位,那么電子設(shè)備便可以在45度方位上點亮指示燈。在另一種實施方式中,如果電子設(shè)備具有顯示屏幕,那么電子設(shè)備也可以在顯示屏幕上顯示用戶聲源方位,或者,在顯示屏幕上顯示指示燈,這都是合理的。在另一種實施方式中,如果電子設(shè)備為機器人等具有可活動部件的電子設(shè)備,那么電子設(shè)備也可以采用轉(zhuǎn)動頭部、揮動胳膊等方式來指示用戶方位。

作為本發(fā)明實施例的一種實施方式,上述方法還可以包括:

判斷從所述用戶聲源方位接收到的語音信號對應(yīng)的交互指令是否為聲源定位方式轉(zhuǎn)換指令;若為是,繼續(xù)接收語音信號,將所接收到的語音信號中音量最大者對應(yīng)的聲源方位確定為用戶聲源方位,并將所接收到的語音信號中音量最大者確定為用戶語音信號,響應(yīng)所述用戶語音信號對應(yīng)的交互指令。

由于電子設(shè)備的應(yīng)用場景是可以變化的,當電子設(shè)備用于響應(yīng)多個用戶發(fā)出的交互指令時,為了更準確地的響應(yīng)該多個用戶發(fā)出的交互指令,電子設(shè)備在接收到來源于用戶聲源方位的語音信號時,可以判斷該語音信號對應(yīng)的交互指令是否為聲源定位方式轉(zhuǎn)換指令,如果是,那么說明用戶發(fā)出了聲源定位方式轉(zhuǎn)換指令,來指示電子設(shè)備的應(yīng)用場景改變了,那么電子設(shè)備便需要響應(yīng)該聲源定位方式轉(zhuǎn)換指令,也就是轉(zhuǎn)換聲源定位的方式。

具體來說,如果該語音信號對應(yīng)的交互指令為聲源定位方式轉(zhuǎn)換指令,那么電子設(shè)備便繼續(xù)接收語音信號,同時轉(zhuǎn)換聲源定位的方式,轉(zhuǎn)換后的聲源定位方式即為:將所接收到的語音信號中音量最大者對應(yīng)的聲源方位確定為用戶聲源方位,可以理解的是,那么電子設(shè)備此時便可以將所接收到的語音信號中音量最大者確定為用戶語音信號,進而,響應(yīng)該用戶語音信號對應(yīng)的交互指令。這樣,在處在不同方位的多個用戶發(fā)出交互指令時,電子設(shè)備可以接收到每個用戶發(fā)出的交互指令,而不是將一個固定的方位作為用戶聲源方位。

當然,在采用轉(zhuǎn)換后的聲源定位方式定位用戶聲源定位后,電子設(shè)備可以對繼續(xù)接收到的語音信號中來源于用戶聲源方位以外的語音信號進行噪聲抑制處理,也可以對繼續(xù)接收到的語音信號中來源于用戶聲源方位的語音信息號進行波束增強處理,進而得到用戶語音信號,這都是合理的。

由于電子設(shè)備判斷所接收的每一語音信號對應(yīng)的交互指令是否為喚醒指令的過程是一樣的,所以,作為本發(fā)明實施例的一種實施方式,所述判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令的步驟,包括:

按照以下方式判斷所接收的每一語音信號對應(yīng)的交互指令是否為喚醒指令:

對目標語音信號進行過濾處理,濾除所述目標語音信號中頻率屬于預設(shè)頻率段的語音信號,其中,所述目標語音信號為:所接收的一個語音信號;

判斷過濾處理后的目標語音信號對應(yīng)的交互指令是否為喚醒指令。

可以理解的是,電子設(shè)備所在的環(huán)境中可能存在多個聲源,那么電子設(shè)備也就會接收到周圍環(huán)境中的各聲源發(fā)出的語音信號,例如,如果電子設(shè)備放置于家庭環(huán)境中,那么該電子設(shè)備可能接收到多個聲源發(fā)出的語音信號,例如,電視機、電冰箱等家電設(shè)備發(fā)出的語音信號,或者窗外傳來的語音信號等。這些聲源所發(fā)出的語音信號中可能有一些語音信號的頻率不屬于人所發(fā)出的語音信號的頻率范圍,所以為了濾除該類語音信號,而更準確地定位用戶聲源方位,電子設(shè)備可以對接收到的每一語音信號進行過濾處理。

具體來說,人發(fā)出的聲音的頻率范圍一般為100-20000hz,那么不屬于該頻率范圍內(nèi)的語音信號即不是人所發(fā)出的語音信號,那么也就不可能是用戶發(fā)出的語音信號,所以,為了有效去除一些不屬于用戶所發(fā)出的語音信號頻率范圍內(nèi)的語音信號對定位用戶聲源方位的不良影響,在判斷所接收的語音信號對應(yīng)的交互指令是否為喚醒指令之前,電子設(shè)備可以對目標語音信號進行過濾處理,濾除目標語音信號中頻率屬于預設(shè)頻率段的語音信號,然后再判斷過濾處理后的目標語音信號對應(yīng)的交互指令是否為喚醒指令,其中,該目標語音信號指代的是電子設(shè)備在睡眠狀態(tài)下所接收的一個語音信號。

上述預設(shè)頻率段可以為不屬于人發(fā)出的聲音頻率范圍內(nèi)的一個或多個頻率段,可以為低頻頻率段,例如,可以為0-100hz;也可以為高頻頻率段,例如20000-40000hz等,當然也可以包括低頻頻率段及高頻頻率段,這都是合理的。

在電子設(shè)備的使用環(huán)境中往往存在一些頻率屬于預設(shè)頻率段的語音信號,例如一些低音音響設(shè)備,其所發(fā)出的語音信號的頻率一般為幾十赫茲,明顯不屬于人發(fā)出的語音信號的頻率范圍,所以采用上述過濾處理方式即可濾除該類語音信號,減少后續(xù)定位用戶聲源方位的工作量,同時使用戶聲源定位更加準確。

對于電子設(shè)備所在環(huán)境中存在多個聲源的情況而言,作為本發(fā)明實施例的一種實施方式,所述定位所接收到的語音信號的聲源方位為用戶聲源方位的步驟,包括:

定位并記錄所接收到的語音信號的聲源方位,作為第二類聲源方位;

根據(jù)第一類聲源方位和所述第二類聲源方位定位用戶聲源方位,其中,所述第一類聲源方位為所述電子設(shè)備處于睡眠狀態(tài)的情況下,定位并記錄的所接收到的語音信號的聲源方位,該語音信號對應(yīng)的交互指令不為喚醒指令。

在電子設(shè)備處于睡眠狀態(tài)的情況下,判斷出所接收到的語音信號未觸發(fā)喚醒指令時,電子設(shè)備可以定位并記錄該語音信號的聲源方位,為了方便描述本發(fā)明實施例所提供的方案,將該語音信號的聲源方位作為第一類聲源方位。

由于此時電子設(shè)備處于睡眠狀態(tài),且所接收到的語音信號對應(yīng)的交互指令不是喚醒指令,所以可以理解的是,此時電子設(shè)備接收到的語音信號是噪音聲源發(fā)出的語音信號,并不是用戶發(fā)出的語音信號,也就不會觸發(fā)電子設(shè)備處理該語音信號,那么電子設(shè)備可以將這些語音信號的聲源方位作為第一類聲源方位記錄下來,也就是作為噪音聲源的方位記錄下來,并繼續(xù)接到語音信號。

當電子設(shè)備判斷出所接收到的語音信號對應(yīng)的交互指令為喚醒指令時,電子設(shè)備可以定位當前接收到的語音信號的聲源方位,并將該聲源方位作為第二類聲源方位記錄下來。

電子設(shè)備記錄了上述第一類聲源方位和第二類聲源方位后,便可以根據(jù)該第一類聲源方位和該第二類聲源方位定位用戶聲源方位。電子設(shè)備在睡眠狀態(tài)下接收到的語音信號可能是變化的,也就是說,隨著時間的推移,可能有一些聲源不再發(fā)出語音信號,而又可能會有一些之前未發(fā)出語音信號的聲源發(fā)出語音信號。

例如,電子設(shè)備在睡眠狀態(tài)下時,可能有電視、空調(diào)在發(fā)出語音信號,過了一段時間,電視可能被關(guān)閉,那么電視所對應(yīng)的第一類聲源方位也就不存在了,又過了一段時間,電腦可能被開啟,播放音樂,那么在第一類聲源方位中便出現(xiàn)了電腦所對應(yīng)的聲源方位。又例如,電子設(shè)備在睡眠狀態(tài)下時,可能在某一時刻,一個人在某處發(fā)出了語音信號,但是該語音信號對應(yīng)的交互指令不是喚醒指令,電子設(shè)備沒有由睡眠狀態(tài)切換至工作狀態(tài),那么電子設(shè)備在此時便會將該人所在的方位記錄在第一類聲源方位中,過了一段時間,該人不再發(fā)出語音信號,所以,第一類聲源方位可能是隨著時間而變化的。

由于電子設(shè)備由睡眠狀態(tài)切換至工作狀態(tài)的時刻之前較長時刻對應(yīng)的第一類聲源方位與第二類聲源方位的差異性可能較大,那么為了更加簡便且準確地定位用戶聲源方位,可以采用第二類聲源方位和電子設(shè)備由睡眠狀態(tài)切換至工作狀態(tài)時刻之前預設(shè)時間段內(nèi)的第一類聲源方位,來確定用戶目標聲源方位。其中,該預設(shè)時間段可以由本領(lǐng)域技術(shù)人員根據(jù)電子設(shè)備的使用場景等實際因素確定,例如,可以為2秒、3秒或5秒等,在此不做具體限定。

在一種實施方式中,根據(jù)第一類聲源方位和第二類聲源方位定位用戶聲源方位的方式可以為:判斷所述第二類聲源方位中是否存在不屬于所述第一類聲源方位的聲源方位;若為是,將第二類聲源方位中不屬于第一類聲源方位的聲源方位定位為用戶聲源方位。

可以理解的是,如果第二類聲源方位中存在不屬于第一類聲源方位的聲源方位,那么該第二類聲源方位中不屬于第一類聲源方位的聲源方位即為:在電子設(shè)備由睡眠狀態(tài)切換至工作狀態(tài)時所定位的,且不屬于第一類聲源方位的聲源方位,那么便可以確定該聲源方位為用戶發(fā)出的對應(yīng)的交互指令為喚醒指令的語音信號的聲源方位,那么該聲源方位即為用戶聲源方位。

舉例而言,電子設(shè)備由睡眠狀態(tài)切換至工作狀態(tài)時刻之前預設(shè)時間段內(nèi)的第一類聲源方位為3個,分別為:0度、30度和90度方位,電子設(shè)備由睡眠狀態(tài)切換至工作狀態(tài)時,記錄的第二聲源方位為4個,分別為:0度、30度、60度和90度方位,顯然,60度聲源方位是在電子設(shè)備由睡眠狀態(tài)切換至工作狀態(tài)時新出現(xiàn)的一個聲源方位,而此時電子設(shè)備剛好接收到了對應(yīng)的交互指令為喚醒指令的語音信號,那么便可以確定該60度聲源方位即為用戶發(fā)出的對應(yīng)的交互指令為喚醒指令的語音信號的聲源方位,也就是用戶聲源方位。

作為本發(fā)明實施例的一種實施方式,所述將所述第二類聲源方位中不屬于所述第一類聲源方位的聲源方位定位為用戶聲源方位的步驟,可以包括:

確定所述第二類聲源方位中不屬于第一類聲源方位的聲源方位的數(shù)量;當所確定的數(shù)量大于1時,將不屬于所述預設(shè)頻率段的語音信號對應(yīng)的聲源方位,確定為所述用戶聲源方位。

在一些情況下,電子設(shè)備在接收到對應(yīng)的交互指令為喚醒指令的語音信號的同時,可能存在另一個或多個聲源方位不屬于第一類聲源方位的其他聲源,這些其他聲源也發(fā)出了語音信號,那么電子設(shè)備也就會接收到這些語音信號。例如,在用戶發(fā)出對應(yīng)的交互指令為喚醒指令的語音信號的同時,低音音響設(shè)備被開啟,發(fā)出語音信號,那么電子設(shè)備便會接收到用戶發(fā)出的語音信號和低音音響設(shè)備發(fā)出的語音信號,顯然,這兩個語音信號的聲源方位均不屬于第一類聲源方位,所以,第二類聲源方位中不屬于第一類聲源方位的聲源方位的數(shù)量在此時便為多個。

在這種情況下,為了準確地定位用戶聲源方位,電子設(shè)備首先可以確定第二類聲源方位中不屬于第一類聲源方位的聲源方位的數(shù)量,如果所確定的數(shù)量大于1,說明此時第二類聲源方位中不屬于第一類聲源方位的聲源方位的數(shù)量是多個,那么電子設(shè)備便可以將不屬于預設(shè)頻率段的語音信號對應(yīng)的聲源方位確定為用戶聲源方位。

舉例而言,在用戶發(fā)出對應(yīng)的交互指令為喚醒指令的語音信號的同時,低音音響設(shè)備被開啟,發(fā)出語音信號,那么電子設(shè)備便會接收到用戶發(fā)出的語音信號和低音音響設(shè)備發(fā)出的語音信號,電子設(shè)備可以確定第二類聲源方位中不屬于第一類聲源方位的聲源方位的數(shù)量為2,顯然是大于1的,那么電子設(shè)備便可以將不屬于預設(shè)頻率段的語音信號對應(yīng)的聲源方位,確定為用戶聲源方位,由于低音音響設(shè)備發(fā)出的語音信號的頻率屬于一個固定的低頻頻率范圍,那么將預設(shè)頻率段設(shè)定為該低頻頻率范圍,便可以準確地將低音音響設(shè)備所在的聲源方位排除,進而,電子設(shè)備便可以準確地確定出用戶聲源方位。

作為本發(fā)明實施例的一種實施方式,所述將不屬于所述預設(shè)頻率段的語音信號對應(yīng)的聲源方位,確定為所述用戶聲源方位的步驟,可以包括:

確定不屬于所述預設(shè)頻率段的語音信號對應(yīng)的聲源方位的數(shù)量;當所確定的數(shù)量大于1時,將所述不屬于所述預設(shè)頻率段的語音信號中,波形與預設(shè)波形的相似度大于第一預設(shè)值的語音信號對應(yīng)的聲源方位確定為所述用戶聲源方位。

由于在一些情況下,不屬于上述預設(shè)頻率段的語音信號對應(yīng)的聲源方位的數(shù)量也可能是大于1的,也就是說,可能存在多個不屬于上述預設(shè)頻率段的語音信號對應(yīng)的聲源方位,那么此時為了準確確定用戶聲源方位,電子設(shè)備可以進一步通過語音信號的波形比較來確定用戶聲源方位。

可以理解的是,用戶聲源方位即為用戶發(fā)出喚醒指令所對應(yīng)的聲源方位,那么上述預設(shè)波形即可以為喚醒詞對應(yīng)的語音信號的波形,這樣,與該預設(shè)波形的相似度大于第一預設(shè)值的波形顯然是與喚醒詞對應(yīng)的語音信號的波形相似度很高的波形,那么也就說明該語音信號對應(yīng)的交互指令很可能就是喚醒指令,那么該語音信號的聲源方位也就是用戶聲源方位。其中,第一預設(shè)值可以由本領(lǐng)域技術(shù)人員根據(jù)電子設(shè)備的使用場景中存在的聲源所發(fā)出語音信號的波形特點等因素進行設(shè)定,在此不做具體限定。

例如,在用戶發(fā)出對應(yīng)的交互指令為喚醒指令的語音信號的同時,還有其他人發(fā)出語音信號,那么電子設(shè)備便會接收到用戶發(fā)出的語音信號和其他人發(fā)出的語音信號,其他人發(fā)出的語音信號的頻率也不屬于預設(shè)頻率段,電子設(shè)備可以確定不屬于上述預設(shè)頻率段的語音信號對應(yīng)的聲源方位的數(shù)量為多個,顯然是大于1的,那么,電子設(shè)備便可以將這多個語音信號的波形與預設(shè)的喚醒詞對應(yīng)的波形進行比較,相似度高于第一預設(shè)值的語音信號的聲源方位,也就是用戶聲源方位??梢姡ㄟ^該語音信號波形比較方式可以更加準確地確定用戶聲源方位。

需要說明的是,在確定出第二類聲源方位中不屬于第一類聲源方位的聲源方位的數(shù)量大于1時,也可以先通過上述語音信號波形比較方式,將與預設(shè)波形相似度較高的波形對應(yīng)的語音信號的聲源方位確定出來,如果所確定出的數(shù)量仍然大于1,那么便可以進一步將不屬于上述預設(shè)頻率段的語音信號對應(yīng)的聲源方位,確定為所述用戶聲源方位,這也是合理的。

作為本發(fā)明實施例的一種實施方式,在所述第二類聲源方位均屬于所述第一類聲源方位的情況下,上述方法還可以包括:

判斷處于同一聲源方位的第一語音信號與第二語音信號的能量差值是否大于第二預設(shè)值;如果是,將該第二語音信號對應(yīng)的第二類聲源方位確定為所述用戶聲源方位,其中,所述第一語音信號為所述電子設(shè)備處于睡眠狀態(tài)時接收到的語音信號,所述第二語音信號為所述電子設(shè)備處于工作狀態(tài)時接收到的語音信號。

由于用戶發(fā)出對應(yīng)的交互指令為喚醒指令的語音信號時,可能正處于與第一類聲源方位中某個聲源方位相同的方位上,那么此時電子設(shè)備定位出的第二類聲源方位就會出現(xiàn)均屬于第一類聲源方位的情況,在這種情況下,為了能夠準確定出用戶聲源方位,電子設(shè)備可以判斷處于同一聲源方位的第一語音信號與第二語音信號的能量差值是否大于第二預設(shè)值。其中,語音信號的能量可以由音量、頻率、波形特征等來表征,在此不做具體限定。

需要說明的是,為了方便描述,上述第一語音信號指代的是電子設(shè)備處于睡眠狀態(tài)時所接收到的語音信號,其對應(yīng)的聲源方位也就是第一類聲源方位,上述第二語音信號指代的是電子設(shè)備處于工作狀態(tài)時所接收到的語音信號,其對應(yīng)的聲源方位也就是第二類聲源方位。進一步需要說明的是,上述第二預設(shè)值可以由本領(lǐng)域技術(shù)人員根據(jù)電子設(shè)備的使用場景中存在的聲源所發(fā)出的語音信號的能量等因素進行設(shè)定,在此不做具體限定。

如果處于同一聲源方位的第一語音信號與第二語音信號的能量差值大于第二預設(shè)值,那么說明第一語音信號與第二語音信號很可能不是同一個聲源發(fā)出的語音信號。舉例來說,如果第一語音信號與第二語音信號都是冰箱所發(fā)出的語音信號,那么二者的能量差值是非常小的,也就不會大于第二預設(shè)值;如果第一語音信號是冰箱所發(fā)出的語音信號,第二語音信號是用戶發(fā)出的語音信號,那么二者的能量差值一般是比較大的,也就會大于第二預設(shè)值。所以當處于同一聲源方位的第一語音信號與第二語音信號的能量差值大于第二預設(shè)值時,電子設(shè)備便可以將該第二語音信號對應(yīng)的第二類聲源方位確定為用戶聲源方位。

作為本發(fā)明實施例的一種實施方式,在所述第二類聲源方位均屬于所述第一類聲源方位的情況下,上述方法還可以包括:

將所述第二類聲源方位中,波形與預設(shè)波形的相似度大于第一預設(shè)值的語音信號對應(yīng)的聲源方位確定為所述用戶聲源方位。

在第二類聲源方位均屬于第一類聲源方位的情況下,電子設(shè)備也可以通過語音信號波形比較的方式確定用戶聲源方位,具體實現(xiàn)方式與上述波形比較方式類似,相關(guān)之處可以參見上述波形比較方式部分的說明,在此不再贅述。

需要說明的是,如果上述處于同一聲源方位的第一語音信號與第二語音信號的能量差值大于第二預設(shè)值的第二語音信號為多個,那么也可以進一步通過比較該多個第二語音信號的波形與預設(shè)波形的相似度來確定用戶聲源方位,具體實施方式可以參見上述語音信號波形比較方式部分的說明,在此不再贅述。

作為本發(fā)明實施例的一種實施方式,所述將所述第二類聲源方位中不屬于所述第一類聲源方位的聲源方位定位為用戶聲源方位的步驟,可以包括:

確定所述第二類聲源方位中不屬于所述第一類聲源方位的聲源方位為目標聲源方位;

根據(jù)所述目標聲源方位,確定目標范圍[a,b],并將所述目標范圍內(nèi)的聲源方位確定為所述用戶聲源方位,其中,a為所述目標聲源方位與第一預設(shè)方位差值的差值,b為所述目標聲源方位與第二預設(shè)方位差值的加和。

可以理解的是,用戶在發(fā)出語音信號的過程中,可能會在小范圍內(nèi)改變自己所處的位置,那么其發(fā)出的語音信號的聲源方位也就會隨之變化,為了可以在這種情況下也能準確地進行語音信號地接收,電子設(shè)備可以將第二類聲源方位中不屬于第一類聲源方位的聲源方位確定為目標聲源方位,然后根據(jù)該目標聲源方位,確定目標范圍[a,b],并將該目標范圍內(nèi)的聲源方位確定為用戶聲源方位。

其中,a可以為目標聲源方位與第一預設(shè)方位差值的差值,b可以為目標聲源方位與第二預設(shè)方位差值的加和。該第一預設(shè)方位差值及第二預設(shè)方位差值可以相等,也可以不相等,其具體取值可以由本領(lǐng)域技術(shù)人員根據(jù)電子設(shè)備的使用場景及用戶的活動情況進行設(shè)定,例如,可以為10度、15度、30度等,在此不做具體限定。

在一種實施方式中,第一預設(shè)方位差值與第二預設(shè)方位差值可以相等,例如,用戶聲源方位為60度方位,第一預設(shè)方位差值及第二預設(shè)方位差值均為30度,那么電子設(shè)備便可以將(60-30=30)度到(60+30=90)度范圍內(nèi)的聲源方位確定為最終的用戶聲源方位。當然,在另一種實施方式中,第一預設(shè)方位差值與第二預設(shè)方位差值可以不相等,例如,用戶聲源方位為60度方位,第一預設(shè)方位差值為10度,第二預設(shè)方位差值為15度,那么電子設(shè)備便可以將(60-10=50)度到(60+15=75)度范圍內(nèi)的聲源方位確定為最終的用戶聲源方位,這都是合理的。

相應(yīng)于上述方法實施例,本發(fā)明實施例還提供了一種語音信號處理裝置,下面對本發(fā)明實施例所提供的一種語音信號處理裝置進行介紹。

如圖2所示,一種語音信號處理裝置,應(yīng)用于具有語音交互功能的電子設(shè)備,所述裝置包括:

喚醒指令判斷模塊210,用于在所述電子設(shè)備處于睡眠狀態(tài)情況下,接收語音信號,并判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令;

聲源定位模塊220,用于在所接收到的語音信號對應(yīng)的交互指令為喚醒指令的情況下,由睡眠狀態(tài)切換至工作狀態(tài),并定位所接收到的語音信號的聲源方位為用戶聲源方位;

用戶語音信號獲得模塊230,用于繼續(xù)接收語音信號,并對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號;

第一交互指令響應(yīng)模塊240,用于響應(yīng)所述用戶語音信號對應(yīng)的交互指令。

可見,本發(fā)明實施例所提供的方案中,具有語音交互功能的電子設(shè)備在處于睡眠狀態(tài)情況下,接收語音信號,并判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令,若為是,由睡眠狀態(tài)切換至工作狀態(tài),并定位所接收到的語音信號的聲源方位為用戶聲源方位,然后繼續(xù)接收語音信號,并對繼續(xù)接收到的語音信號中來源于用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號,進而響應(yīng)用戶語音信號對應(yīng)的交互指令。電子設(shè)備將喚醒指令所對應(yīng)的聲源方位確定為用戶聲源方位,并對繼續(xù)接收到的語音信號中該方位以外的語音信號進行噪聲抑制處理,獲得的用戶語音信號即為處于用戶聲源方位的用戶發(fā)出的語音信號,因此可以進行正確的響應(yīng),提升用戶體驗。

作為本發(fā)明實施例的一種實施方式,所述用戶語音信號獲得模塊230可以包括:

用戶語音信號獲得子模塊(圖2中未示出),用于對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位以外的語音信號進行噪聲抑制處理,并對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位的語音信息號進行波束增強處理,獲得所述用戶語音信號。

電子設(shè)備對繼續(xù)接收到的語音信號中來源于用戶聲源方位的語音信息號進行波束增強處理,增加來源于用戶聲源方位的語音信息號的能量,這樣電子設(shè)備可以將波束增強處理后的語音信號作為用戶語音信號,對用戶語音信號進行更準確地解析識別,得到正確的交互指令,進而,正確地響應(yīng)該交互指令。

作為本發(fā)明實施例的一種實施方式,所述裝置還可以包括:

用戶方位指示模塊(圖2中未示出),用于按照所述用戶聲源方位指示用戶方位。

電子設(shè)備可以按照用戶聲源方位指示用戶方位,可以方便用戶查看當前用戶聲源方位。

作為本發(fā)明實施例的一種實施方式,所述裝置還可以包括:

轉(zhuǎn)換指令判斷模塊(圖2中未示出),用于判斷從所述用戶聲源方位接收到的語音信號對應(yīng)的交互指令是否為聲源定位方式轉(zhuǎn)換指令;

第二交互指令響應(yīng)模塊(圖2中未示出),用于在從所述用戶聲源方位接收到的語音信號對應(yīng)的交互指令為聲源定位方式轉(zhuǎn)換指令的情況下,繼續(xù)接收語音信號,將所接收到的語音信號中音量最大者對應(yīng)的聲源方位確定為用戶聲源方位,并將所接收到的語音信號中音量最大者確定為用戶語音信號,響應(yīng)所述用戶語音信號對應(yīng)的交互指令。

電子設(shè)備在接收到來源于用戶聲源方位的語音信號時,可以判斷該語音信號對應(yīng)的交互指令是否為聲源定位方式轉(zhuǎn)換指令,如果是,那么說明用戶發(fā)出了聲源定位方式轉(zhuǎn)換指令,來指示電子設(shè)備的應(yīng)用場景改變了,那么電子設(shè)備便可以響應(yīng)該聲源定位方式轉(zhuǎn)換指令,以響應(yīng)多個用戶發(fā)出的交互指令,并可以更準確地的響應(yīng)該交互指令。

作為本發(fā)明實施例的一種實施方式,所述喚醒指令判斷模塊210可以包括:

信號過濾子模塊(圖2中未示出)和指令判斷子模塊(圖2中未示出);

所述喚醒指令判斷模塊210,具體用于通過所述信號過濾子模塊和指令判斷子模塊判斷所接收的每一語音信號對應(yīng)的交互指令是否為喚醒指令;

所述信號過濾子模塊,用于對目標語音信號進行過濾處理,濾除所述目標語音信號中頻率屬于預設(shè)頻率段的語音信號,其中,所述目標語音信號為:所接收的一個語音信號;

所述指令判斷子模塊,用于判斷過濾處理后的目標語音信號對應(yīng)的交互指令是否為喚醒指令。

在電子設(shè)備的使用環(huán)境中往往存在一些頻率屬于預設(shè)頻率段的語音信號,例如一些低音音響設(shè)備,其所發(fā)出的語音信號的頻率一般為幾十赫茲,明顯不屬于人發(fā)出的語音信號的頻率范圍,所以采用上述過濾處理方式即可濾除該類語音信號,減少后續(xù)定位用戶聲源方位的工作量,同時使用戶聲源定位更加準確。

作為本發(fā)明實施例的一種實施方式,所述聲源定位模塊220可以包括:

聲源定位子模塊(圖2中未示出),用于定位并記錄所接收到的語音信號的聲源方位,作為第二類聲源方位;

用戶聲源方位確定子模塊(圖2中未示出),用于根據(jù)第一類聲源方位和所述第二類聲源方位定位用戶聲源方位,其中,所述第一類聲源方位為所述電子設(shè)備處于睡眠狀態(tài)的情況下,定位并記錄的所接收到的語音信號的聲源方位,該語音信號對應(yīng)的交互指令不為喚醒指令。

在電子設(shè)備處于存在多個聲源的環(huán)境中時,通過第一類聲源方位和第二類聲源方位可以準確定位用戶聲源方位。

作為本發(fā)明實施例的一種實施方式,所述用戶聲源方位確定子模塊可以包括:

判斷單元(圖2中未示出),用于判斷所述第二類聲源方位中是否存在不屬于所述第一類聲源方位的聲源方位;

用戶聲源方位確定單元(圖2中未示出),用于在所述第二類聲源方位中存在不屬于所述第一類聲源方位的聲源方位的情況下,將所述第二類聲源方位中不屬于所述第一類聲源方位的聲源方位定位為用戶聲源方位。

由于第二類聲源方位中不屬于第一類聲源方位的聲源方位即為:在電子設(shè)備由睡眠狀態(tài)切換至工作狀態(tài)時所定位的,且不屬于第一類聲源方位的聲源方位,那么便可以確定該聲源方位為用戶發(fā)出的對應(yīng)的交互指令為喚醒指令的語音信號的聲源方位,那么便可以準確定位用戶聲源方位。

作為本發(fā)明實施例的一種實施方式,所述用戶聲源方位確定單元可以包括:

數(shù)量確定子單元(圖2中未示出),用于確定所述第二類聲源方位中不屬于第一類聲源方位的聲源方位的數(shù)量;

第一方位確定單元(圖2中未示出),用于當所確定的數(shù)量大于1時,將不屬于預設(shè)頻率段的語音信號對應(yīng)的聲源方位,確定為所述用戶聲源方位。

由于低音音響等能夠發(fā)出噪音的設(shè)備所發(fā)出的語音信號的頻率一般屬于一個固定的頻率范圍,那么將預設(shè)頻率段設(shè)定為該固定頻率范圍,電子設(shè)備可以將不屬于預設(shè)頻率段的語音信號對應(yīng)的聲源方位,確定為用戶聲源方位,這樣可以準確地將屬于預設(shè)頻率段的語音信號的聲源方位排除,進而,電子設(shè)備便可以準確地確定出用戶聲源方位。

作為本發(fā)明實施例的一種實施方式,所述第一方位確定子單元,具體可以用于確定不屬于所述預設(shè)頻率段的語音信號對應(yīng)的聲源方位的數(shù)量;當所確定的數(shù)量大于1時,將所述不屬于所述預設(shè)頻率段的語音信號中,波形與預設(shè)波形的相似度大于第一預設(shè)值的語音信號對應(yīng)的聲源方位確定為所述用戶聲源方位。

通過將不屬于預設(shè)頻率段的語音信號中,波形與預設(shè)波形的相似度的判斷,可以在不屬于預設(shè)頻率段的語音信號為多個時,準確定位用戶聲源方位。

作為本發(fā)明實施例的一種實施方式,所述裝置還可以包括:

能量差值判斷模塊(圖2中未示出),用于在所述第二類聲源方位均屬于所述第一類聲源方位的情況下,判斷處于同一聲源方位的第一語音信號與第二語音信號的能量差值是否大于第二預設(shè)值,其中,所述第一語音信號為所述電子設(shè)備處于睡眠狀態(tài)時接收到的語音信號,所述第二語音信號為所述電子設(shè)備處于工作狀態(tài)時接收到的語音信號;如果是,將該第二語音信號對應(yīng)的第二類聲源方位確定為所述用戶聲源方位。

由于用戶發(fā)出對應(yīng)的交互指令為喚醒指令的語音信號時,可能正處于與第一類聲源方位中某個聲源方位相同的方位上,那么此時電子設(shè)備定位出的第二類聲源方位就會出現(xiàn)均屬于第一類聲源方位的情況,在這種情況下,如果處于同一聲源方位的第一語音信號與第二語音信號的能量差值大于第二預設(shè)值,那么說明第一語音信號與第二語音信號很可能不是同一個聲源發(fā)出的語音信號。所以當處于同一聲源方位的第一語音信號與第二語音信號的能量差值大于第二預設(shè)值時,電子設(shè)備便可以將該第二語音信號對應(yīng)的第二類聲源方位確定為用戶聲源方位。

作為本發(fā)明實施例的一種實施方式,所述裝置還可以包括:

波形比較模塊(圖2中未示出),用于將所述第二類聲源方位中,波形與預設(shè)波形的相似度大于第一預設(shè)值的語音信號對應(yīng)的聲源方位確定為所述用戶聲源方位。

通過將第二類聲源方位對應(yīng)的語音信號的波形與預設(shè)波形的相似度的判斷,可以在第二類聲源方位均屬于第一類聲源方位的情況下,準確定位用戶聲源方位。

作為本發(fā)明實施例的一種實施方式,所述用戶聲源方位確定子模塊可以包括:

目標聲源方位確定單元(圖2中未示出),用于確定所述第二類聲源方位中不屬于所述第一類聲源方位的聲源方位為目標聲源方位;

第二方位確定單元(圖2中未示出),用于根據(jù)所述目標聲源方位,確定目標范圍[a,b],并將所述目標范圍內(nèi)的聲源方位確定為所述用戶聲源方位,其中,a為所述目標聲源方位與第一預設(shè)方位差值的差值,b為所述目標聲源方位與第二預設(shè)方位差值的加和。

用戶在發(fā)出語音信號的過程中,可能會在小范圍內(nèi)改變自己所處的位置,那么其發(fā)出的語音信號的聲源方位也就會隨之變化,采用上述用戶聲源方位確定方式,電子設(shè)備可以在這種情況下準確地進行語音信號地接收,進而進行準確地響應(yīng)行為。

本發(fā)明實施例還提供了一種電子設(shè)備,下面對本發(fā)明實施例所提供的電子設(shè)備進行介紹。

如圖3所示,一種電子設(shè)備,所述電子設(shè)備包括:

殼體301、處理器302、存儲器303、電路板304和電源電路305,其中,電路板304安置在殼體301圍成的空間內(nèi)部,處理器302和存儲器303設(shè)置在電路板304上;電源電路305,用于為電子設(shè)備的各個電路或器件供電;存儲器303用于存儲可執(zhí)行程序代碼;處理器302通過讀取存儲器303中存儲的可執(zhí)行程序代碼來運行與可執(zhí)行程序代碼對應(yīng)的程序,以用于執(zhí)行上述方法實施例中所述的語音信號處理方法。

一種實現(xiàn)方式中,上述語音信號處理方法可以包括:

在所述電子設(shè)備處于睡眠狀態(tài)情況下,接收語音信號,并判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令;

若為是,由睡眠狀態(tài)切換至工作狀態(tài),并定位所接收到的語音信號的聲源方位為用戶聲源方位;

繼續(xù)接收語音信號,并對繼續(xù)接收到的語音信號中來源于所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號;

響應(yīng)所述用戶語音信號對應(yīng)的交互指令。

上述語音信號處理方法的其他實現(xiàn)方式參見前述方法實施例部分的說明,這里不再贅述。

處理器302對上述步驟及上述語音信號處理方法的其他實現(xiàn)方式的具體執(zhí)行過程以及處理器302通過運行可執(zhí)行程序代碼來進一步執(zhí)行的過程,可以參見本發(fā)明實施例中圖1及圖2所示實施例的描述,在此不再贅述。

需要說明的是,該電子設(shè)備以多種形式存在,包括但不限于:

(1)移動通信設(shè)備:這類設(shè)備的特點是具備移動通信功能,并且以提供話音、數(shù)據(jù)通信為主要目標。這類終端包括:智能手機(例如iphone)、多媒體手機、功能性手機,以及低端手機等。

(2)超移動個人計算機設(shè)備:這類設(shè)備屬于個人計算機的范疇,有計算和處理功能,一般也具備移動上網(wǎng)特性。這類終端包括:pda、mid和umpc設(shè)備等,例如ipad。

(3)便攜式娛樂設(shè)備:這類設(shè)備可以顯示和播放多媒體內(nèi)容。該類設(shè)備包括:音頻、視頻播放器(例如ipod),掌上游戲機,電子書,以及智能玩具和便攜式車載導航設(shè)備。

(4)服務(wù)器:提供計算服務(wù)的設(shè)備,服務(wù)器的構(gòu)成包括處理器、硬盤、內(nèi)存、系統(tǒng)總線等,服務(wù)器和通用的計算機架構(gòu)類似,但是由于需要提供高可靠的服務(wù),因此在處理能力、穩(wěn)定性、可靠性、安全性、可擴展性、可管理性等方面要求較高。

(5)其他具有數(shù)據(jù)交互功能的電子裝置。

可見,本發(fā)明實施例所提供的方案中,電子設(shè)備的處理器通過讀取存儲器中存儲的可執(zhí)行程序代碼來運行與可執(zhí)行程序代碼對應(yīng)的程序,在處于睡眠狀態(tài)情況下,接收語音信號,并判斷所接收到的語音信號對應(yīng)的交互指令是否為喚醒指令,若為是,由睡眠狀態(tài)切換至工作狀態(tài),并定位所接收到的語音信號的聲源方位為用戶聲源方位,然后繼續(xù)接收語音信號,并對繼續(xù)接收到的語音信號中來源于用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號,進而響應(yīng)用戶語音信號對應(yīng)的交互指令。電子設(shè)備將喚醒指令所對應(yīng)的聲源方位確定為用戶聲源方位,并對繼續(xù)接收到的語音信號中該方位以外的語音信號進行噪聲抑制處理,獲得的用戶語音信號即為處于用戶聲源方位的用戶發(fā)出的語音信號,因此可以進行正確的響應(yīng),提升用戶體驗。

對于電子設(shè)備實施例而言,由于其基本相似于方法實施例,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。

需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。

本說明書中的各個實施例均采用相關(guān)的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于裝置實施例而言,由于其基本相似于方法實施例,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。

以上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進等,均包含在本發(fā)明的保護范圍內(nèi)。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1