日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

處理語音文本的方法及裝置的制造方法

文檔序號:8319135閱讀:493來源:國知局
處理語音文本的方法及裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及信息處理技術領域,特別涉及一種處理語音文本的方法及裝置。
【背景技術】
[0002]隨著信息處理技術的不斷發(fā)展,以自然語言進行人機交互成為現(xiàn)實。實現(xiàn)人機交互的關鍵是要準確理解用戶發(fā)出的自然語言指令并進行相應的操作。用戶在發(fā)出自然語言指令后,該指令被轉換為語音文本,如何處理語音文本,成為人們關注的問題。
[0003]現(xiàn)有技術有兩種處理語音文本的方式,第一種方式:對語音文本進行詞匯映射,得到映射結果;通過規(guī)則卡位提取映射結果中的位置參數(shù),得到卡位提取結果;將卡位提取結果和預設規(guī)則進行匹配,得到一個匹配規(guī)則;根據(jù)得到的一個匹配規(guī)則對語音文本進行處理。其中,規(guī)則卡位是根據(jù)正則規(guī)則獲得的指定位置。第二種方式:對語音文本進行命名實體映射,得到第一映射結果;對命名實體映射的結果進行詞匯映射,得到第二映射結果;將第二映射結果和預設規(guī)則進行匹配,得到一個匹配規(guī)則;根據(jù)得到的一個匹配規(guī)則對語音文本進行處理。
[0004]在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術至少存在以下問題:
[0005]正則規(guī)則不夠靈活,不適用于實際的語言環(huán)境。命名實體規(guī)則對于比較固定的語言環(huán)境以及不適宜建立實體命名庫的場景,不能充分發(fā)揮作用。因此,現(xiàn)有技術提供的兩種處理語音文本的方式均具有一定的局限性,導致語音文本的處理方式不夠優(yōu)化。

【發(fā)明內(nèi)容】

[0006]為了解決現(xiàn)有技術的問題,本發(fā)明實施例提供了一種處理語音文本的方法及裝置。所述技術方案如下:
[0007]一方面,提供了一種處理語音文本的方法,所述方法包括:
[0008]對語音文本進行命名實體映射,得到第一映射結果;
[0009]對所述第一映射結果進行詞匯映射,得到第二映射結果;
[0010]將所述第二映射結果與包括正則規(guī)則的預設規(guī)則進行匹配,如果得到一個匹配規(guī)貝U,則根據(jù)得到的一個匹配規(guī)則對所述語音文本進行處理。
[0011]另一方面,提供了一種處理語音文本的裝置,所述裝置包括:
[0012]第一映射模塊,用于對語音文本進行命名實體映射,得到第一映射結果;
[0013]第二映射模塊,用于對所述第一映射結果進行詞匯映射,得到第二映射結果;
[0014]匹配模塊,用于將所述第二映射結果與包括正則規(guī)則的預設規(guī)則進行匹配;
[0015]第一處理模塊,用于當?shù)玫揭粋€匹配規(guī)則時,根據(jù)得到的一個匹配規(guī)則對所述語音文本進行處理。
[0016]本發(fā)明實施例提供的技術方案帶來的有益效果是:
[0017]通過對語音文本進行命名實體映射,得到第一映射結果;對第一映射結果進行詞匯映射,得到第二映射結果;之后將第二映射結果與包括正則規(guī)則的預設規(guī)則進行匹配,并根據(jù)得到的一個匹配規(guī)則對語音文本進行處理,從而將正則規(guī)則和命名實體規(guī)則的配置格式統(tǒng)一,使處理語音文本技術既適用于實際的語言環(huán)境,又適用于固定的語言環(huán)境,擴大了處理語音文本技術的適用范圍,從而使語音文本的處理方式得到了優(yōu)化。
【附圖說明】
[0018]為了更清楚地說明本發(fā)明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0019]圖1是本發(fā)明實施例一提供的處理語音文本的方法流程圖;
[0020]圖2是本發(fā)明實施例二提供的處理語音文本的方法流程圖;
[0021]圖3是本發(fā)明實施例三提供的第一種處理語音文本的裝置結構示意圖;
[0022]圖4是本發(fā)明實施例三提供的第二種處理語音文本的裝置結構示意圖;
[0023]圖5是本發(fā)明實施例三提供的第三種處理語音文本的裝置結構示意圖;
[0024]圖6是本發(fā)明實施例四提供的處理語音文本的終端結構示意圖。
【具體實施方式】
[0025]為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明實施方式作進一步地詳細描述。
[0026]實施例一
[0027]本發(fā)明實施例提供了一種處理語音文本的方法,參見圖1,方法流程包括如下步驟:
[0028]101:對語音文本進行命名實體映射,得到第一映射結果;
[0029]102:對第一映射結果進行詞匯映射,得到第二映射結果;
[0030]進一步地,對第一映射結果進行詞匯映射之前,包括:
[0031]將第一映射結果中的一至多個命名實體依次展開為映射前對應的語音文本,得到至少兩個第三映射結果;
[0032]對第一映射結果進行詞匯映射,包括:
[0033]將每個第三映射結果中未被映射為命名實體的語音文本進行詞匯映射,得到第二映射結果。
[0034]103:將第二映射結果與包括正則規(guī)則的預設規(guī)則進行匹配,如果得到一個匹配規(guī)貝U,則根據(jù)得到的一個匹配規(guī)則對語音文本進行處理。
[0035]進一步地,將第二映射結果與包括正則規(guī)則的預設規(guī)則進行匹配之后,還包括:
[0036]如果得到至少兩個匹配規(guī)則,則對得到的所有匹配規(guī)則依次進行匹配寬度消岐處理、匹配加權值消岐處理、匹配密度消岐處理、命中數(shù)量消岐處理以及命名實體權值消岐處理中的至少一種消岐處理,直至得到一個消岐后的匹配規(guī)則;
[0037]根據(jù)得到的一個消岐后的匹配規(guī)則對語音文本進行處理。
[0038]進一步地,匹配寬度消岐處理,包括:
[0039]確定每個匹配規(guī)則對應的第二映射結果的匹配寬度,將匹配寬度最大的匹配規(guī)則作為經(jīng)過匹配寬度消岐處理的匹配規(guī)則。
[0040]進一步地,匹配加權值消岐處理,包括:
[0041]按照預先設置的詞匯與命名實體的加權值確定每個待進行匹配加權值消岐處理的匹配規(guī)則的加權值;
[0042]將加權值最大的匹配規(guī)則作為經(jīng)過匹配加權值消岐處理的匹配規(guī)則;
[0043]其中,待進行匹配加權值消岐處理的匹配規(guī)則為經(jīng)過匹配寬度消岐處理的匹配規(guī)則。
[0044]進一步地,匹配密度消岐處理,包括:
[0045]確定每個待進行匹配密度消岐處理的匹配規(guī)則與第二映射結果的匹配比重,將匹配比重最大的匹配規(guī)則作為經(jīng)過匹配密度消岐處理的匹配規(guī)則;
[0046]其中,每個待進行匹配密度消岐處理的匹配規(guī)則為經(jīng)過匹配寬度消岐處理的匹配規(guī)則。
[0047]進一步地,命中數(shù)量消岐處理,包括:
[0048]確定每個待進行命中數(shù)量消岐處理的匹配規(guī)則的參數(shù)命中數(shù)量,參數(shù)為命名實體、詞匯和位置參數(shù)中的一個;
[0049]將參數(shù)命中數(shù)量最大的匹配結果作為經(jīng)過命中數(shù)量消岐處理的匹配規(guī)則;
[0050]其中,每個待進行命中數(shù)量消岐處理的匹配規(guī)則為經(jīng)過匹配寬度消岐處理的匹配規(guī)則。
[0051]進一步地,命名實體權值消岐處理,包括:
[0052]確定每個待進行命名實體權值消岐處理的匹配規(guī)則中命名實體的權重值,將命名實體的權重值最大的匹配規(guī)則作為經(jīng)過命名實體權值消岐處理的匹配規(guī)則;
[0053]其中,每個待進行命名實體權值消岐處理的匹配規(guī)則為經(jīng)過匹配寬度消岐處理的匹配規(guī)則。
[0054]本實施例提供的方法,通過對語音文本進行命名實體映射,得到第一映射結果;對第一映射結果進行詞匯映射,得到第二映射結果;之后將第二映射結果與包括正則規(guī)則的預設規(guī)則進行匹配,并根據(jù)得到的一個匹配規(guī)則對語音文本進行處理,從而將正則規(guī)則和命名實體規(guī)則的配置格式統(tǒng)一,使處理語音文本技術既適用于實際的語言環(huán)境,又適用于固定的語言環(huán)境,擴大了處理語音文本技術的適用范圍,從而使語音文本的處理方式得到了優(yōu)化。
[0055]實施例二
[0056]本發(fā)明實施例提供了一種處理語音文本的方法,結合上述實施例一的內(nèi)容,參見圖2,方法流程包括:
[0057]201:對語音文本進行命名實體映射,得到第一映射結果;
[0058]具體地,對語音文本進行命名實體映射,包括但不限于:建立命名實體庫;在語音文本中查找能夠被識別為命名實體庫中的命名實體的語音本文,并用命名實體替換查找到的語音文本。需要說明的是,命名實體是從網(wǎng)上大量的信息中搜集的,并且命名實體的識別是使用各個領域獨立字典樹的實現(xiàn)方式,即能夠支持到命名實體全部重合或部分重合的情況下找出所有的命名實體。
[0059]為了便于理解,以語音文本為“我想聽第一次”,命名實體用中文大括號【】表示為例進行說明。建立的命名實體中語音文本“我想”及“第一次”都對應命名實體【歌名】;在語音文本中查找到語音文本“我想”及“第一次”都能夠被識別為命名實體庫中的【歌名】,用命名實體【歌名】替換查找到的語音文本“我想”及“第一次”后得到第一映射結果,即【歌名】聽【歌名】。
[0060]202:將第一映射結果中的一至多個命名實體依次展開為映射前對應的語音文本,得到至少兩個第三映射結果;
[0061]針對該步驟,由于命名實體可能和詞匯重疊,則將第一映射結果中的一至多個命名實體依次展開為映射前對應的語音文本,得到至少兩個第三映射結果,從而增加了映射結果,避免命名實體和詞匯重疊的情況下不能準確處理語音文本。
[0062]需要說明的是,如果第一映射結果中沒有命名實體部分重疊的情況,并且第一映射結果中一共有η個命名實體,則將一至多個命名實體依次展開為映射前對應的語音文本后得到2~η個第三映射結果。
[0063]為了便于理解,仍以語音文本為“我想聽第一次”為例進行說明。其中,語音文本對應的第一映射結果為【歌名】聽【歌名】。將【歌名】聽【歌名】中的兩個命名實體依次展開為映射前對應的語音文本,得到【歌名】聽【歌名】、我想聽【歌名】、【歌名】聽第一次、我想聽第一次,這四個第三映射結果。
[0064]203:將每個第三映射結果中未被映射為命名實體的語音文本進行詞匯映射,得到第二映射結果;
[0065]針對該步驟,進行詞匯映射中的詞匯是人工配置的,將日常語言中表達相同含義的語音文本映射為相同的詞匯。由于相同含義的語音文本在實際的語言環(huán)境中可能對應不同的語音文本,將未被映射為命名實體的語音文本進行詞匯映射,可以減少重復匹配的工作量。關于將每個第三映射結果中未被映射為命名實體的語音文本進行詞匯映射的方式,本實施例不作具體限定。
[0066]為了便于理解,以上述步驟202中的第三映射結果為例進行說明。其中,“我想聽”映射到詞匯〈播放 &g
當前第1頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1