一種語音識別的方法及系統(tǒng)的制作方法

文檔序號：10513509閱讀：558來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種語音識別的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種語音識別的方法及系統(tǒng)。該方法，包括：一種語音識別的方法，其特征在于，包括：檢測出與用戶臉部的距離小于等于預(yù)置距離；識別出用戶臉部的嘴型發(fā)生變化；對錄取的語音進行識別。本發(fā)明能夠在用戶對著設(shè)備進行語音時，自動開啟語音識別，對用戶的語音進行識別，減少了開啟的操作，提高了用戶體驗。
【專利說明】
一種語音識別的方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及數(shù)據(jù)存儲技術(shù)領(lǐng)域，尤其涉及一種語音識別的方法及系統(tǒng)。
【背景技術(shù)】
[0002]語音的開啟模塊對整個語音識別的體驗是至關(guān)重要的，同時好的開啟模式還對避免噪音干擾起著很大的幫助?，F(xiàn)有的語音識別開啟模式主要有兩種:一種是觸摸操作之后開啟語音識別，如:按屏幕上的開啟按鈕，或是定義滑屏等操作來開啟，或是按實體鈕鍵來開啟一個功能的語音識別功能，但這種方式在開啟語音識別功能時，需要用手操作，顯得不夠便捷、智能，影響了用戶的使用意愿，在有些場合，如開車時更顯得不方便;另一種是用戶講規(guī)定好的簡單命令來開啟，如華為的智能手表，就是通過對手表說:“hello，安卓”這樣簡單且規(guī)定好的命令來開啟它的語音識別模式。但是這種方式顯得不自然，智能感降低，并且在在語音識別之前都要有個命令識別過程，也會讓效率降低。
[0003]如何在用戶對著設(shè)備進行講話后，系統(tǒng)就能自動識別，不需要用戶有一個語音的開啟動作，能自動在用戶開始講話時就自動開啟，使語音識別更便捷、智能，提高用戶體驗是急需解決的冋題。

【發(fā)明內(nèi)容】

[0004]本發(fā)明提供了一種語音識別的方法及系統(tǒng)，通過根據(jù)與用戶臉部的距離和嘴型的變化來進行語音識別，實現(xiàn)了在用戶對著設(shè)備進行語音時，自動開啟語音識別，對用戶的語音進行識別，減少了開啟的操作，提高了用戶體驗。
[0005]為實現(xiàn)上述設(shè)計，本發(fā)明采用以下技術(shù)方案:
[0006]—方面，提供了一種語音識別的方法，包括:
[0007]檢測出與用戶臉部的距離小于等于預(yù)置距離；
[0008]識別出用戶臉部的嘴型發(fā)生變化；
[0009]對錄取的語音進行識別。
[0010]優(yōu)選地，所述檢測出與用戶臉部的距離小于等于預(yù)置距離，包括:通過攝像頭檢測出與用戶臉部的距離小于等于預(yù)置距離；
[0011]所述檢測出與用戶臉部的距離小于等于預(yù)置距離之前，還包括:檢測出抬手動作，開啟攝像頭。
[0012]優(yōu)選地，所述檢測出與用戶臉部的距離小于等于預(yù)置距離，包括:
[0013]利用紅外傳感器檢測與物體的距離小于等于預(yù)置距離；
[0014]通過攝像頭確定所述物體為用戶臉部。
[0015]優(yōu)選地，所述檢測出與用戶臉部的距離小于等于預(yù)置距離之后，還包括:開啟錄
■~>V.曰O
[0016]優(yōu)選地，所述對錄取的語音進行識別，包括:去除識別出用戶臉部的嘴型發(fā)生變化之前的錄音，從識別出用戶臉部的嘴型發(fā)生變化時的錄音作為起始點，對錄取的語音進行識別。
[0017]優(yōu)選地，所述對錄取的語音進行識別之后，還包括:對識別出的語音命令進行響應(yīng)。
[0018]另一方面，提供了一種語音識別的系統(tǒng)，該系統(tǒng)，包括:
[0019]距離檢測模塊，用于檢測出與用戶臉部的距離小于等于預(yù)置距離；
[0020]嘴型識別模塊，用于識別出用戶臉部的嘴型發(fā)生變化；
[0021 ]語音識別模塊，用于對錄取的語音進行識別。
[0022]優(yōu)選地:
[0023]所述距離檢測模塊具體用于:通過攝像頭檢測出與用戶臉部的距離小于等于預(yù)置距離；
[0024]還包括:開啟模塊，用于檢測出抬手動作，開啟攝像頭。
[0025]優(yōu)選地，所述距離檢測模塊具體用于:
[0026]利用紅外傳感器檢測出與物體的距離小于等于預(yù)置距離；
[0027]通過攝像頭確定所述物體為用戶臉部。
[0028]優(yōu)選地，還包括:
[0029]錄音開啟模塊，用于在距離檢測模塊檢測出與用戶臉部的距離小于等于預(yù)置距離之后開啟錄首；
[0030]響應(yīng)模塊，用于對識別出的語音命令進行響應(yīng)；
[0031]所述語音識別模塊，具體用于:去除識別出用戶臉部的嘴型發(fā)生變化之前的錄音，從識別出用戶臉部的嘴型發(fā)生變化時的錄音作為起始點，對錄取的語音進行識別。
[0032]與現(xiàn)有技術(shù)相比，本發(fā)明的有益效果為:檢測出與用戶臉部的距離小于等于預(yù)置距離;識別出用戶臉部的嘴型發(fā)生變化;對錄取的語音進行識別。本發(fā)明通過根據(jù)與用戶臉部的距離和嘴型的變化來進行語音識別，實現(xiàn)了在用戶對著設(shè)備進行語音時，自動開啟語音識別，對用戶的語音進行識別，減少了開啟的操作，提高了用戶體驗。
【附圖說明】
[0033]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案，下面將對本發(fā)明實施例描述中所需要使用的附圖作簡單的介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動的前提下，還可以根據(jù)本發(fā)明實施例的內(nèi)容和這些附圖獲得其他的附圖。
[0034]圖1是本發(fā)明【具體實施方式】中提供的一種語音識別的方法的第一實施例的方法流程圖。
[0035]圖2是本發(fā)明【具體實施方式】中提供的一種語音識別的方法的第二實施例的方法流程圖。
[0036]圖3是本發(fā)明【具體實施方式】中提供的一種語音識別的方法的第三實施例的方法流程圖。
[0037]圖4是本發(fā)明【具體實施方式】中提供的一種語音識別的系統(tǒng)的第一實施例的結(jié)構(gòu)方框圖。
[0038]圖5是本發(fā)明【具體實施方式】中提供的一種語音識別的系統(tǒng)的第二實施例的結(jié)構(gòu)方框圖。
[0039]圖6是本發(fā)明【具體實施方式】中提供的一種語音識別的系統(tǒng)的第三實施例的結(jié)構(gòu)方框圖。
【具體實施方式】
[0040]為使本發(fā)明解決的技術(shù)問題、采用的技術(shù)方案和達(dá)到的技術(shù)效果更加清楚，下面將結(jié)合附圖對本發(fā)明實施例的技術(shù)方案作進一步的詳細(xì)描述，顯然，所描述的實施例僅僅是本發(fā)明一部分實施例，而不是全部的實施例?；诒景l(fā)明中的實施例，本領(lǐng)域技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護的范圍。
[0041]請參考圖1，其是本發(fā)明【具體實施方式】中提供的一種語音識別的方法的第一實施例的方法流程圖。如圖所示，該方法，包括:
[0042]步驟SlOl:檢測出與用戶臉部的距離小于等于預(yù)置距離。
[0043]當(dāng)用戶需要對設(shè)備進行語音控制時，用戶會靠近設(shè)備進行講話，也相當(dāng)于用戶臉部靠近設(shè)備，為提高語音的錄取質(zhì)量，需檢測設(shè)備與用戶臉部的距離是否小于等于預(yù)置距離，所述預(yù)置距離為5cm、10cm或15cm等，可根據(jù)不同設(shè)備和實際使用環(huán)境來進行設(shè)置。所述設(shè)備包括:大型智能設(shè)備，如智能手表、智能手環(huán)等的穿戴便攜設(shè)備，如手機、平板等的非穿戴便攜設(shè)備等等。
[0044]步驟S102:識別出用戶臉部的嘴型發(fā)生變化。
[0045]為避免在臉部靠近但還沒發(fā)音時，錄入環(huán)境噪音，影響識別率，需要進行嘴型識另IJ，如果識別出用戶的嘴型有發(fā)音的變化與動作，就以當(dāng)前時間點為控制語音的起始點。
[0046]步驟S103:對錄取的語音進行識別。
[0047]所述對錄取的語音進行識別，包括:去除識別出用戶臉部的嘴型發(fā)生變化之前的錄音，從識別出用戶臉部的嘴型發(fā)生變化時的錄音作為起始點，對錄取的語音進行識別。去除起始點之前的錄音，在一定程度上去除環(huán)境噪聲對語音識別的影響，提高識別率。
[0048]綜上所述，本實施例通過根據(jù)與用戶臉部的距離和嘴型的變化來進行語音識別，以識別出用戶臉部的嘴型發(fā)生變化時的錄音作為語音識別的起始點，在一定程度上去除了環(huán)境噪聲對語音識別的影響，提高了識別率，本實施例實現(xiàn)了在用戶對著設(shè)備進行語音時，自動開啟語音識別，對用戶的語音進行識別，減少了開啟的操作，提高了用戶體驗。
[0049]請參考圖2，其是本發(fā)明【具體實施方式】中提供的一種語音識別的方法的第二實施例的方法流程圖。如圖所示，該方法，包括:
[0050]步驟S201:檢測出抬手動作，開啟攝像頭。
[0051]對于智能手表、智能手環(huán)等的穿戴便攜設(shè)備來說，當(dāng)用戶需要語音控制時，是需要抬手的，對應(yīng)的會有一個抬手動作，但抬手不一定會進行語音控制，因此，當(dāng)檢測出抬手動作時，還需要進行臉部識別，檢測出有抬手動作，也識別出臉部，則說明用戶需要進行語音控制。本實施例利用攝像頭進行臉部識別和距離的監(jiān)測，所以當(dāng)檢測出抬手動作時，開啟攝像頭?？梢岳眉铀俣葌鞲衅鳈z測出抬手動作，這是現(xiàn)有技術(shù)，此處不再贅述。
[0052]步驟S202:通過攝像頭檢測出與用戶臉部的距離小于等于預(yù)置距離。
[0053]當(dāng)用戶臉部與設(shè)備的距離小于等于預(yù)置距離，說明用戶需要進行語音控制。利用攝像頭進行臉部識別和距離的檢測，以檢測出與用戶臉部的距離小于等于預(yù)置距離，所述預(yù)置距離為5cm、10cm或15cm等，可根據(jù)不同設(shè)備和實際使用環(huán)境來進行設(shè)置。步驟S202為本發(fā)明【具體實施方式】中提供的一種語音識別的方法的第一實施例中步驟S101:檢測出與用戶臉部的距離小于等于預(yù)置距離的針對智能手表、智能手環(huán)等穿戴便攜設(shè)備的更具體的實施方案。
[0054]步驟S203:開啟錄音。
[0055]當(dāng)檢測出與用戶臉部的距離小于等于預(yù)置距離之后，就開啟錄音。
[0056]步驟S204:識別出用戶臉部的嘴型發(fā)生變化。
[0057]為避免在臉部靠近但還沒發(fā)音時，錄入環(huán)境噪音，影響識別率，需要進行嘴型識另IJ，如果識別出用戶的嘴型有發(fā)音的變化與動作，就以當(dāng)前時間點為控制語音的起始點。
[0058]步驟S205:對錄取的語音進行識別。
[0059]所述對錄取的語音進行識別，包括:去除識別出用戶臉部的嘴型發(fā)生變化之前的錄音，從識別出用戶臉部的嘴型發(fā)生變化時的錄音作為起始點，對錄取的語音進行識別。去除起始點之前的錄音，在一定程度上去除環(huán)境噪聲對語音識別的影響，提高識別率。
[0060]步驟S206:對識別出的語音命令進行響應(yīng)。
[0061]對識別出的語音命令進行響應(yīng)，所述語音命令可以是打開某個應(yīng)用程序、關(guān)閉某個應(yīng)用程度、打電話、發(fā)信息等。
[0062]本實施例當(dāng)檢測出抬手動作時就開啟攝像頭，利用攝像頭來進行臉部識別和距離的監(jiān)測，當(dāng)攝像頭檢測出與用戶臉部的距離小于等于預(yù)置距離時，開啟錄音，去除識別出用戶臉部的嘴型發(fā)生變化之前的錄音，以識別出用戶的嘴型有發(fā)音的變化與動作的時間點作為控制語音的起始點，對錄取的語音進行識別，并對識別出的語音命令進行響應(yīng)。本實施例在用戶有抬手動作，靠近設(shè)備進行發(fā)音后，能立即進行語音命令的響應(yīng)，不用事先做開啟的動作，整個過程自然，操作效率高，在一定程度上去除環(huán)境噪聲對語音識別的影響，提高識別率。
[0063]請參考圖3，其是本發(fā)明【具體實施方式】中提供的一種語音識別的方法的第三實施例的方法流程圖。如圖所示，該方法，包括:
[0064]步驟S301:利用紅外傳感器檢測與物體的距離小于等于預(yù)置距離。
[0065]當(dāng)用戶需要對設(shè)備進行語音控制時，用戶會靠近設(shè)備進行講話，因此可利用紅外傳感器檢測在預(yù)置距離范圍內(nèi)是否有物體接近，也就相當(dāng)于利用紅外傳感器檢測設(shè)備與物體的距離是否小于等于預(yù)置距離。
[0066]步驟S302:通過攝像頭確定所述物體為用戶臉部。
[0067]當(dāng)紅外傳感器檢測設(shè)備與物體的距離小于等于預(yù)置距離，說明有物體接近，但不代表一定是需要進行語音控制，還可能會是其他情況，例如剛好有個物體擺放在設(shè)備前面，或是設(shè)備放在了一個物體上面，因此還需要通過攝像頭確定所述物體為用戶臉部，說明是用戶在靠近設(shè)備，需要對設(shè)備進行語音控制。步驟S301與步驟S302為本發(fā)明【具體實施方式】中提供的一種語音識別的方法的第一實施例中步驟SlOl:檢測出與用戶臉部的距離小于等于預(yù)置距離的更具體的實施方案。
[0068]所述設(shè)備包括:大型智能設(shè)備，如智能手表、智能手環(huán)等的穿戴便攜設(shè)備，如手機、平板等的非穿戴便攜設(shè)備等等。所述預(yù)置距離為5cm、10cm或15cm等，可根據(jù)不同設(shè)備和實際使用環(huán)境來進行設(shè)置。利用紅外傳感器檢測與物體的距離小于等于預(yù)置距離之后，開啟攝像頭，通過攝像頭確定所述物體為用戶臉部。
[0069]步驟S303:開啟錄音。
[0070]當(dāng)檢測出與用戶臉部的距離小于等于預(yù)置距離之后，就開啟錄音。
[0071]步驟S304:識別出用戶臉部的嘴型發(fā)生變化。
[0072]為避免在臉部靠近但還沒發(fā)音時，錄入環(huán)境噪音，影響識別率，需要進行嘴型識另IJ，如果識別出用戶的嘴型有發(fā)音的變化與動作，就以當(dāng)前時間點為控制語音的起始點。
[0073]步驟S305:對錄取的語音進行識別。
[0074]所述對錄取的語音進行識別，包括:去除識別出用戶臉部的嘴型發(fā)生變化之前的錄音，從識別出用戶臉部的嘴型發(fā)生變化時的錄音作為起始點，對錄取的語音進行識別。去除起始點之前的錄音，在一定程度上去除環(huán)境噪聲對語音識別的影響，提高識別率。
[0075]步驟S306:對識別出的語音命令進行響應(yīng)。
[0076]對識別出的語音命令進行響應(yīng)，所述語音命令可以是打開某個應(yīng)用程序、關(guān)閉某個應(yīng)用程度、打電話、發(fā)信息等。
[0077]本實施例利用紅外傳感器檢測與物體的距離小于等于預(yù)置距離，通過攝像頭確定所述物體為用戶臉部，利用紅外傳感器和攝像頭的結(jié)合來檢測出設(shè)備與用戶臉部的距離小于等于預(yù)置距離后，開啟錄音，去除識別出用戶臉部的嘴型發(fā)生變化之前的錄音，以識別出用戶的嘴型有發(fā)音的變化與動作的時間點作為控制語音的起始點，對錄取的語音進行識另IJ，并對識別出的語音命令進行響應(yīng)。本實施例在用戶靠近設(shè)備進行發(fā)音后，能立即進行語音命令的響應(yīng)，不用事先做開啟的動作，整個過程自然，操作效率高，在一定程度上去除環(huán)境噪聲對語音識別的影響，提高識別率。
[0078]以下是本發(fā)明【具體實施方式】中提供的一種語音識別的系統(tǒng)的實施例，系統(tǒng)的實施例基于上述的方法的實施例實現(xiàn)，在系統(tǒng)中未盡的描述，請參考前述方法的實施例。
[0079]請參考圖4，其是本發(fā)明【具體實施方式】中提供的一種語音識別的系統(tǒng)的第一實施例的結(jié)構(gòu)方框圖。如圖所示，該系統(tǒng)，包括:
[0080]距離檢測模塊41，用于檢測出與用戶臉部的距離小于等于預(yù)置距離。
[0081]當(dāng)用戶需要對設(shè)備進行語音控制時，用戶會靠近設(shè)備進行講話，也相當(dāng)于用戶臉部靠近設(shè)備，為提高語音的錄取質(zhì)量，需檢測設(shè)備與用戶臉部的距離是否小于等于預(yù)置距離，所述預(yù)置距離為5cm、10cm或15cm等，可根據(jù)不同設(shè)備和實際使用環(huán)境來進行設(shè)置。所述設(shè)備包括:大型智能設(shè)備，如智能手表、智能手環(huán)等的穿戴便攜設(shè)備，如手機、平板等的非穿戴便攜設(shè)備等等。
[0082]嘴型識別模塊42，用于識別出用戶臉部的嘴型發(fā)生變化。
[0083]為避免在臉部靠近但還沒發(fā)音時，錄入環(huán)境噪音，影響識別率，需要進行嘴型識另IJ，如果識別出用戶的嘴型有發(fā)音的變化與動作，就以當(dāng)前時間點為控制語音的起始點。
[0084]語音識別模塊43，用于對錄取的語音進行識別。
[0085]所述語音識別模塊43，具體用于:去除識別出用戶臉部的嘴型發(fā)生變化之前的錄音，從識別出用戶臉部的嘴型發(fā)生變化時的錄音作為起始點，對錄取的語音進行識別。去除起始點之前的錄音，在一定程度上去除環(huán)境噪聲對語音識別的影響，提高識別率。
[0086]綜上所述，本實施例通過根據(jù)與用戶臉部的距離和嘴型的變化來進行語音識別，以識別出用戶臉部的嘴型發(fā)生變化時的錄音作為語音識別的起始點，在一定程度上去除了環(huán)境噪聲對語音識別的影響，提高了識別率，本實施例實現(xiàn)了在用戶對著設(shè)備進行語音時，自動開啟語音識別，對用戶的語音進行識別，減少了開啟的操作，提高了用戶體驗。
[0087]請參考圖5，其是本發(fā)明【具體實施方式】中提供的一種語音識別的系統(tǒng)的第二實施例的結(jié)構(gòu)方框圖。如圖所示，該系統(tǒng)，包括:
[0088]開啟模塊51，用于檢測出抬手動作，開啟攝像頭。
[0089]對于智能手表、智能手環(huán)等的穿戴便攜設(shè)備來說，當(dāng)用戶需要語音控制時，是需要抬手的，對應(yīng)的會有一個抬手動作，但抬手不一定會進行語音控制，因此，當(dāng)檢測出抬手動作時，還需要進行臉部識別，檢測出有抬手動作，也識別出臉部，則說明用戶需要進行語音控制。本實施例利用攝像頭進行臉部識別和距離的監(jiān)測，所以當(dāng)檢測出抬手動作時，開啟攝像頭?？梢岳眉铀俣葌鞲衅鳈z測出抬手動作，這是現(xiàn)有技術(shù)，此處不再贅述。
[0090]距離檢測模塊52，用于通過攝像頭檢測出與用戶臉部的距離小于等于預(yù)置距離。
[0091]當(dāng)用戶臉部與設(shè)備的距離小于等于預(yù)置距離，說明用戶需要進行語音控制。利用攝像頭進行臉部識別和距離的檢測，以檢測出與用戶臉部的距離小于等于預(yù)置距離，所述預(yù)置距離為5cm、10cm或15cm等，可根據(jù)不同設(shè)備和實際使用環(huán)境來進行設(shè)置。
[0092]錄音開啟模塊53，用于在距離檢測模塊52檢測出與用戶臉部的距離小于等于預(yù)置距離之后開啟錄音。
[0093]嘴型識別模塊54，用于識別出用戶臉部的嘴型發(fā)生變化。
[0094]為避免在臉部靠近但還沒發(fā)音時，錄入環(huán)境噪音，影響識別率，需要進行嘴型識另IJ，如果識別出用戶的嘴型有發(fā)音的變化與動作，就以當(dāng)前時間點為控制語音的起始點。
[0095]語音識別模塊55，用于對錄取的語音進行識別。
[0096]所述語音識別模塊55，具體用于:去除識別出用戶臉部的嘴型發(fā)生變化之前的錄音，從識別出用戶臉部的嘴型發(fā)生變化時的錄音作為起始點，對錄取的語音進行識別。去除起始點之前的錄音，在一定程度上去除環(huán)境噪聲對語音識別的影響，提高識別率。
[0097]響應(yīng)模塊56，用于對識別出的語音命令進行響應(yīng)。
[0098]本實施例利用攝像頭檢測出與用戶臉部的距離小于等于預(yù)置距離，以識別出用戶的嘴型有發(fā)音的變化與動作的時間點作為控制語音的起始點，對錄取的語音進行識別，并對識別出的語音命令進行響應(yīng)。本實施例在用戶有抬手動作，靠近設(shè)備進行發(fā)音后，能立即進行語音命令的響應(yīng)，不用事先做開啟的動作，整個過程自然，操作效率高，在一定程度上去除環(huán)境噪聲對語音識別的影響，提高識別率。
[0099]請參考圖6，其是本發(fā)明【具體實施方式】中提供的一種語音識別的系統(tǒng)的第三實施例的結(jié)構(gòu)方框圖。如圖所示，該系統(tǒng)，包括:
[0100]距離檢測模塊61，用于利用紅外傳感器檢測出與物體的距離小于等于預(yù)置距離；通過攝像頭確定所述物體為用戶臉部。
[0101]當(dāng)用戶需要對設(shè)備進行語音控制時，用戶會靠近設(shè)備進行講話，因此可利用紅外傳感器檢測在預(yù)置距離范圍內(nèi)是否有物體接近，也就相當(dāng)于利用紅外傳感器檢測設(shè)備與物體的距離是否小于等于預(yù)置距離。所述設(shè)備包括:大型智能設(shè)備，如智能手表、智能手環(huán)等的穿戴便攜設(shè)備，如手機、平板等的非穿戴便攜設(shè)備等等。所述預(yù)置距離為5cm、10cm或15cm等，可根據(jù)不同設(shè)備和實際使用環(huán)境來進行設(shè)置。利用紅外傳感器檢測與物體的距離小于等于預(yù)置距離之后，開啟攝像頭，通過攝像頭確定所述物體為用戶臉部。
[0102]錄音開啟模塊62，用于在距離檢測模塊檢測出與用戶臉部的距離小于等于預(yù)置距尚之后開啟錄首。
[0103]嘴型識別模塊63，用于識別出用戶臉部的嘴型發(fā)生變化。
[0104]為避免在臉部靠近但還沒發(fā)音時，錄入環(huán)境噪音，影響識別率，需要進行嘴型識另IJ，如果識別出用戶的嘴型有發(fā)音的變化與動作，就以當(dāng)前時間點為控制語音的起始點。
[0105]語音識別模塊64，用于對錄取的語音進行識別。
[0106]響應(yīng)模塊65，用于對識別出的語音命令進行響應(yīng)。
[0107]對識別出的語音命令進行響應(yīng)，所述語音命令可以是打開某個應(yīng)用程序、關(guān)閉某個應(yīng)用程度、打電話、發(fā)信息等。
[0108]綜上所述，本實施例提供語音識別的系統(tǒng)在用戶靠近設(shè)備進行發(fā)音后，能立即進行語音命令的響應(yīng)，不用事先做開啟的動作，整個過程自然，操作效率高，在一定程度上去除環(huán)境噪聲對語音識別的影響，提高識別率。
[0109]以上結(jié)合具體實施例描述了本發(fā)明的技術(shù)原理。這些描述只是為了解釋本發(fā)明的原理，而不能以任何方式解釋為對本發(fā)明保護范圍的限制。基于此處的解釋，本領(lǐng)域的技術(shù)人員不需要付出創(chuàng)造性的勞動即可聯(lián)想到本發(fā)明的其它【具體實施方式】，這些方式都將落入本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1.一種語音識別的方法，其特征在于，包括: 檢測出與用戶臉部的距離小于等于預(yù)置距離；識別出用戶臉部的嘴型發(fā)生變化；對錄取的語音進行識別。2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述檢測出與用戶臉部的距離小于等于預(yù)置距離，包括:通過攝像頭檢測出與用戶臉部的距離小于等于預(yù)置距離；所述檢測出與用戶臉部的距離小于等于預(yù)置距離之前，還包括:檢測出抬手動作，開啟攝像頭。3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述檢測出與用戶臉部的距離小于等于預(yù)置距離，包括: 利用紅外傳感器檢測與物體的距離小于等于預(yù)置距離；通過攝像頭確定所述物體為用戶臉部。4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述檢測出與用戶臉部的距離小于等于預(yù)置距離之后，還包括:開啟錄音。5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述對錄取的語音進行識別，包括:去除識別出用戶臉部的嘴型發(fā)生變化之前的錄音，從識別出用戶臉部的嘴型發(fā)生變化時的錄音作為起始點，對錄取的語音進行識別。6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述對錄取的語音進行識別之后，還包括:對識別出的語音命令進行響應(yīng)。7.一種語音識別的系統(tǒng)，其特征在于，包括: 距離檢測模塊，用于檢測出與用戶臉部的距離小于等于預(yù)置距離；嘴型識別模塊，用于識別出用戶臉部的嘴型發(fā)生變化；語音識別模塊，用于對錄取的語音進行識別。8.根據(jù)權(quán)利要求7所述的系統(tǒng)，其特征在于: 所述距離檢測模塊具體用于:通過攝像頭檢測出與用戶臉部的距離小于等于預(yù)置距離；還包括:開啟模塊，用于檢測出抬手動作，開啟攝像頭。9.根據(jù)權(quán)利要求7所述的系統(tǒng)，其特征在于，所述距離檢測模塊具體用于: 利用紅外傳感器檢測出與物體的距離小于等于預(yù)置距離；通過攝像頭確定所述物體為用戶臉部。10.根據(jù)權(quán)利要求7所述的系統(tǒng)，其特征在于，還包括: 錄音開啟模塊，用于在距離檢測模塊檢測出與用戶臉部的距離小于等于預(yù)置距離之后開啟錄首；響應(yīng)模塊，用于對識別出的語音命令進行響應(yīng)；所述語音識別模塊，具體用于:去除識別出用戶臉部的嘴型發(fā)生變化之前的錄音，從識別出用戶臉部的嘴型發(fā)生變化時的錄音作為起始點，對錄取的語音進行識別。
【文檔編號】G10L15/25GK105869639SQ201610165978
【公開日】2016年8月17日
【申請日】2016年3月21日
【發(fā)明人】房少杰
【申請人】廣東小天才科技有限公司

完整全部詳細(xì)技術(shù)資料下載