一種語音識別系統(tǒng)及方法

文檔序號：9507144閱讀：645來源：國知局

一種語音識別系統(tǒng)及方法
【技術領域】
[0001]本發(fā)明涉及語音識別技術領域，尤其涉及一種語音識別系統(tǒng)及方法。
【背景技術】
[0002]語音識別技術是機器通過識別和理解過程將人發(fā)出的聲音、音節(jié)或短語轉(zhuǎn)換為相應的文字或符號，或者給出響應，如執(zhí)行控制、做出回答等，它的應用領域非常廣泛，幾乎涉及生活的每個領域，比如計算機控制、工業(yè)控制、信息網(wǎng)絡查詢等等。
[0003]語音識別系統(tǒng)按照不同識別系統(tǒng)的要求，可以劃分成很多不同的種類。比如，根據(jù)識別對象的不同，可分為:孤立字(詞)識別、連接詞識別、連續(xù)語音識別；按照說話人的限定范圍可以分為:特定人和非特定人語音識別系統(tǒng)；按照識別方法分，主要有:模板匹配法、概率模型法、基于人工神經(jīng)網(wǎng)絡等系統(tǒng)。通常，語音識別系統(tǒng)都會設置一個詞匯表，系統(tǒng)對包含于該詞匯表中的詞條進行識別。在現(xiàn)有技術中，基本都是半自動識別，需要人工參與后續(xù)執(zhí)行動作，因此效率比較低。另外，現(xiàn)有技術中大多都是采用一次識別，這樣不僅識別率比較低，還會影響識別的準確性。

【發(fā)明內(nèi)容】

[0004]本發(fā)明所要解決的技術問題是針對上述現(xiàn)有技術的不足，提供一種語音識別系統(tǒng)及方法。
[0005]本發(fā)明解決上述技術問題的技術方案如下:
[0006]依據(jù)本發(fā)明的一個方面，提供了一種語音識別系統(tǒng)，包括采集模塊、轉(zhuǎn)化模塊、提取模塊、匹配模塊、執(zhí)行模塊和語音數(shù)據(jù)庫。所述采集模塊用于采集待識別語音信息；所述轉(zhuǎn)化模塊用于將所述待識別語音信息轉(zhuǎn)化為所述提取模塊可識別的第一標準音頻信息；所述提取模塊用于對所述第一標準音頻信息進行解析并提取所述第一標準音頻信息中的關鍵字；所述匹配模塊用于調(diào)用所述語音數(shù)據(jù)庫中預先存儲的目標命令詞并將其與所述第一標準音頻信息中的關鍵字進行匹配，如果匹配成功，則將對應的目標命令詞發(fā)送至執(zhí)行模塊；所述執(zhí)行模塊接收目標命令詞并執(zhí)行對應的目標動作；所述語音數(shù)據(jù)庫用于存儲設定的目標命令詞。
[0007]依據(jù)本發(fā)明的另一個方面，提供了一種語音識別方法，，包括:
[0008]步驟1:采集待識別語音信息；
[0009]步驟2:將所述待識別語音信息轉(zhuǎn)化為可識別的第一標準音頻信息；
[0010]步驟3:對所述第一標準音頻信息進行解析并提取所述第一標準音頻信息中的關鍵字；
[0011]步驟4:調(diào)用語音數(shù)據(jù)庫中預先存儲的目標命令詞并將其與所述第一標準音頻信息中的關鍵字進行匹配，如果匹配成功，則將對應的目標命令詞發(fā)送至執(zhí)行模塊；
[0012]步驟5:所述執(zhí)行模塊接收目標命令詞并執(zhí)行對應的目標動作。
[0013]本發(fā)明的有益效果是:本發(fā)明的一種語音識別系統(tǒng)及方法，通過對采集的待識別語音信號進行轉(zhuǎn)化和提取處理，提高了語音信號的識別率和識別的準確性，并通過對應的執(zhí)行模塊執(zhí)行相應的目標動作，實現(xiàn)了語音控制的自動化和智能化，在保證語音識別質(zhì)量的前提下，大大提高了識別系統(tǒng)的靈活性，增強了用戶體驗和操作效率。
【附圖說明】
[0014]圖1為本發(fā)明的一種語音識別系統(tǒng)結構示意圖；
[0015]圖2為為本發(fā)明的一種語音識別方法流程圖。
【具體實施方式】
[0016]以下結合附圖對本發(fā)明的原理和特征進行描述，所舉實例只用于解釋本發(fā)明，并非用于限定本發(fā)明的范圍。
[0017]實施例一、一種語音識別系統(tǒng)，下面將結合附圖1對本發(fā)明的一種語音識別系統(tǒng)進行詳細描述。
[0018]如圖1所示，一種語音識別系統(tǒng)結構示意圖，包括采集模塊、轉(zhuǎn)化模塊、提取模塊、匹配模塊、執(zhí)行模塊和語音數(shù)據(jù)庫。
[0019]其中，所述采集模塊用于采集待識別語音信息；所述轉(zhuǎn)化模塊用于將所述待識別語音信息轉(zhuǎn)化為所述提取模塊可識別的第一標準音頻信息；所述提取模塊用于對所述第一標準音頻信息進行解析并提取所述第一標準音頻信息中的關鍵字；所述匹配模塊用于調(diào)用所述語音數(shù)據(jù)庫中預先存儲的目標命令詞并將其與所述第一標準音頻信息中的關鍵字進行匹配，如果匹配成功，則將對應的目標命令詞發(fā)送至執(zhí)行模塊；所述執(zhí)行模塊接收目標命令詞并執(zhí)行對應的目標動作；所述語音數(shù)據(jù)庫用于存儲設定的目標命令詞。
[0020]本實施例的一種語音識別系統(tǒng)還包括預處理模塊，所述預處理模塊用于在所述采集模塊采集待識別語音信息后對所述待識別語音信息進行模數(shù)轉(zhuǎn)換、方法、反混疊濾波和預加重處理，并將預處理后的信號發(fā)送至轉(zhuǎn)化模塊。通過所述預處理模塊可以對所述采集模塊采集的待識別語音信號進行優(yōu)化處理，出去其中的雜質(zhì)成分，便于后續(xù)的轉(zhuǎn)化模塊識別，提高識別效率和識別的準確性。
[0021]優(yōu)選地，本實施例的一種語音識別系統(tǒng)還包括補充采集模塊，所述補充采集模塊用于當所述匹配模塊匹配失敗時采集補充語音信息，所述預處理模塊對所述補充語音信息進行預處理，再經(jīng)所述轉(zhuǎn)化模塊將預處理后的補充語音信息轉(zhuǎn)化為所述提取模塊可識別的第二標準音頻信息，并依次調(diào)用提取模塊和匹配模塊。通過所述補充采集模塊可以提高語音識別的成功率，與傳統(tǒng)的識別系統(tǒng)相比，本實施例所述的一種語音識別系統(tǒng)在當所述匹配模塊匹配失敗時可以進行補充識別，這在實際應用過程中具有非常重要的意義。
[0022]優(yōu)選地，所述匹配模塊對所述第二標準音頻信息中的關鍵字與所述語音數(shù)據(jù)庫中預先存儲的目標命令詞匹配失敗，則重復進行下一次匹配，當匹配失敗次數(shù)達到預設閾值時，則提示無法識別。通過這種方式可以進一步提高語音識別的成功率。在實際中，補充語音識別存在識別不成功的情況，設有通過這種方式，可以使得對補充語音信號的識別成功率大大提尚。
[0023]優(yōu)選地，所述語音數(shù)據(jù)庫中存儲的目標命令詞按照匹配時匹配成功次數(shù)進行降序排列。針對一個特定的語音識別系統(tǒng)，通過對前期識別數(shù)據(jù)的的分析，我們發(fā)現(xiàn)在識別時，特定的目標命令詞匹配成功的次數(shù)會比較高，也就是說，客戶執(zhí)行某個目標動作的頻率比較高，所以對所述語音數(shù)據(jù)庫中存儲的目標命令詞按照匹配時匹配成功次數(shù)進行降序排列，可以提高系統(tǒng)的識別效率，縮短識別時間，增強用戶的體驗。
[0024]實施例二、一種語音識別方法，下面將結合附圖2對本發(fā)明的一種語音識別方法進行詳細描述。
[0025]如圖2所示，一種語音識別方法流程圖，包括:
[0026]步驟1:采集待識別語音信息；
[0027]步驟2:將所述待識別語音信息轉(zhuǎn)化為可識別的第一標準音頻信息；
[0028]步驟3:對所述第一標準音頻信息進行解析并提取所述第一標準音頻信息中的關鍵字；
[0029]步驟4:調(diào)用語音數(shù)據(jù)庫中預先存儲的目標命令詞并將其與所述第一標準音頻信息中的關鍵字進行

完整全部詳細技術資料下載

當前第1頁1 2