日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種信息識別的方法及裝置與流程

文檔序號:11155175閱讀:635來源:國知局
一種信息識別的方法及裝置與制造工藝

本發(fā)明涉及信息處理領(lǐng)域,尤其涉及一種信息識別的方法及裝置。



背景技術(shù):

隨著科學(xué)技術(shù)的發(fā)展,信息識別技術(shù)日益受到人們所關(guān)注,例如,終端可以通過信息識別技術(shù)來過濾掉推銷、詐騙等垃圾信息,以免用戶受到打擾。

現(xiàn)有的信息識別技術(shù)中需要首先識別通知信息中所包括的目標(biāo)單關(guān)鍵詞。在識別出目標(biāo)單關(guān)鍵詞后,為了提高識別的準(zhǔn)確性,防止誤判,還需要根據(jù)已識別的目標(biāo)單關(guān)鍵詞,進(jìn)一步識別目標(biāo)組合關(guān)鍵詞,其中,目標(biāo)組合關(guān)鍵詞由目標(biāo)單關(guān)鍵詞組合而成。當(dāng)識別出通知信息中包含目標(biāo)組合關(guān)鍵詞時,可以確定通知信息為預(yù)設(shè)類型信息。

但是,在識別目標(biāo)組合關(guān)鍵詞的過程中,需要遍歷所有的組合關(guān)鍵詞。在實際應(yīng)用中,隨著待識別通知信息多樣性的日益增加,組合關(guān)鍵詞的數(shù)量也將激增,使得信息識別技術(shù)具有較高的時間復(fù)雜度,進(jìn)而導(dǎo)致信息識別技術(shù)的效率下降。



技術(shù)實現(xiàn)要素:

為解決上述技術(shù)問題,本發(fā)明實施例期望提供一種信息識別的方法及裝置,以降低信息識別的時間復(fù)雜度,提高信息識別的效率。

本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:

第一方面,本發(fā)明實施例提供一種信息識別的方法,所述方法包括:接收通知信息;在確定所述通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞之后,在所述關(guān)鍵詞集中獲取包括所述目標(biāo)單關(guān)鍵詞的目標(biāo)組合關(guān)鍵詞;將所述通知信息與所述目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,獲得匹配結(jié)果;當(dāng)所述匹配結(jié)果表明所述通知信息中包括所述目標(biāo)組合關(guān)鍵詞時,將所述通知信息確定為預(yù)設(shè)類型信息。

進(jìn)一步地,所述在所述關(guān)鍵詞集中獲取包括所述目標(biāo)單關(guān)鍵詞的目標(biāo)組合關(guān)鍵詞,包括:根據(jù)所述目標(biāo)單關(guān)鍵詞對應(yīng)的位置信息,在所述關(guān)鍵詞集中獲取所述目標(biāo)組合關(guān)鍵詞。

進(jìn)一步地,在所述確定所述通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞之前,所述方法還包括:獲取首字符相同的單關(guān)鍵詞;按照所述單關(guān)鍵詞的特征值的大小順序,將所述單關(guān)鍵詞存儲至所述關(guān)鍵詞集中。

進(jìn)一步地,所述確定所述通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞,包括:通過對所述通知信息進(jìn)行分詞,獲取所述通知信息的特征詞;在所述關(guān)鍵詞集中查找出與所述特征詞的首字符相同的所述單關(guān)鍵詞;根據(jù)所述單關(guān)鍵詞的存儲順序,依次比較所述特征詞的特征值與所述單關(guān)鍵詞的特征值;當(dāng)在所述單關(guān)鍵詞中確定出所述目標(biāo)單關(guān)鍵詞時,確定所述通知信息中包括目標(biāo)單關(guān)鍵詞,其中,所述目標(biāo)單關(guān)鍵詞為與所述特征詞的特征值相等的單關(guān)鍵詞。

進(jìn)一步地,所述在接收通知信息之后,且在確定所述通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞之前,所述方法還包括:讀取與所述通知信息所屬業(yè)務(wù)對應(yīng)的所述關(guān)鍵詞集。

第二方面,本發(fā)明實施例提供一種信息識別的裝置,所述裝置包括:接收單元,用于接收通知信息;匹配單元,用于在確定所述通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞之后,在所述關(guān)鍵詞集中獲取包括所述目標(biāo)單關(guān)鍵詞的目標(biāo)組合關(guān)鍵詞;將所述通知信息與所述目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,獲得匹配結(jié)果;確定單元,用于當(dāng)所述匹配結(jié)果表明所述通知信息中包括所述目標(biāo)組合關(guān)鍵詞時,將所述通知信息確定為預(yù)設(shè)類型信息。

進(jìn)一步地,所述匹配單元,具體用于根據(jù)所述目標(biāo)單關(guān)鍵詞對應(yīng)的位置信息,在所述關(guān)鍵詞集中獲取所述目標(biāo)組合關(guān)鍵詞。

進(jìn)一步地,所述裝置還包括:獲取單元,用于獲取首字符相同的單關(guān)鍵詞;存儲單元,用于按照所述單關(guān)鍵詞的特征值的大小順序,將所述單關(guān)鍵詞存儲至所述關(guān)鍵詞集中。

進(jìn)一步地,所述匹配單元,具體用于通過對所述通知信息進(jìn)行分詞,獲取所述通知信息的特征詞;在所述關(guān)鍵詞集中查找出與所述特征詞的首字符相同的所述單關(guān)鍵詞;根據(jù)所述單關(guān)鍵詞的存儲順序,依次比較所述特征詞的特征值與所述單關(guān)鍵詞的特征值;當(dāng)在所述單關(guān)鍵詞中確定出所述目標(biāo)單關(guān)鍵詞時,確定所述通知信息中包括目標(biāo)單關(guān)鍵詞,其中,所述目標(biāo)單關(guān)鍵詞為與所述特征詞的特征值相等的單關(guān)鍵詞。

進(jìn)一步地,所述匹配單元,還用于在確定所述通知信息中包括所述目標(biāo)單關(guān)鍵詞之前,讀取與所述通知信息所屬業(yè)務(wù)對應(yīng)的所述關(guān)鍵詞集。

本發(fā)明實施例提供了一種信息識別的方法及裝置,首先,該裝置在接收到通知信息后,確定該通知信息中所包括的目標(biāo)單關(guān)鍵詞,然后,在關(guān)鍵詞集中獲取包括目標(biāo)單關(guān)鍵詞的目標(biāo)組合關(guān)鍵詞,接下來,上述裝置僅將通知信息與目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,獲得匹配結(jié)果,那么,當(dāng)匹配結(jié)果表明通知信息中包含目標(biāo)組合關(guān)鍵詞時,將通知信息確定為預(yù)設(shè)類型信息??梢?,該裝置無需如現(xiàn)有技術(shù)一般將通知信息與關(guān)鍵詞集中所有的組合關(guān)鍵詞進(jìn)行匹配,而是僅需要和少量的目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,大大降低了通知消息與關(guān)鍵詞的匹配次數(shù),進(jìn)而降低了信息識別的時間復(fù)雜度,提高了信息識別方法的效率。

附圖說明

圖1為本發(fā)明實施例一中提供的信息識別的方法流程示意圖;

圖2為本發(fā)明實施例二中提供的信息識別的方法流程示意圖;

圖3為本發(fā)明實施例三中提供的信息識別裝置的一種結(jié)構(gòu)示意圖;

圖4為本發(fā)明實施例三中提供的信息識別裝置的另一種結(jié)構(gòu)示意圖。

具體實施方式

下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述。

實施例一

本實施例提供一種信息識別的方法,應(yīng)用于信息識別裝置。該信息識別裝置可以為智能手機(jī)、平板電腦智能手表等終端,還可以為服務(wù)器、網(wǎng)絡(luò)監(jiān)控器等網(wǎng)絡(luò)設(shè)備,本發(fā)明實施例不作具體限定。

參見圖1所示,該信息識別的方法可以包括:

S101:接收通知信息;

在實際應(yīng)用中,通知信息可以為終端接收到的短信、即時消息等,還可以為網(wǎng)絡(luò)設(shè)備接收到的用于網(wǎng)絡(luò)設(shè)備間進(jìn)行通信的業(yè)務(wù)信息,本發(fā)明實施例不作具體限定。

S102:在確定通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞之后,在關(guān)鍵詞集中獲取包括目標(biāo)單關(guān)鍵詞的目標(biāo)組合關(guān)鍵詞;

這里,為了對通知信息進(jìn)行識別,信息識別裝置中需要存儲與預(yù)設(shè)類型信息相對應(yīng)的關(guān)鍵詞集,該關(guān)鍵詞集中包括單關(guān)鍵詞與由單關(guān)鍵詞按照預(yù)設(shè)規(guī)則組成的組合關(guān)鍵詞。其中,單關(guān)鍵詞與組合關(guān)鍵詞可以通過機(jī)器學(xué)習(xí)的方式,從大量的預(yù)設(shè)類型信息中提取。需要說明的是,在實際應(yīng)用中預(yù)設(shè)規(guī)則可以根據(jù)具體情況進(jìn)行設(shè)置,本發(fā)明實施例對此不作限定。較佳的,單關(guān)鍵詞可以按照與、或、非等邏輯關(guān)系組成組合關(guān)鍵詞。

示例的,當(dāng)信息識別裝置接收到通知信息后,需要首先判斷通知信息中是否包括關(guān)鍵詞集中的單關(guān)鍵詞。例如,可以通過在通知信息中依次查找關(guān)鍵詞集中的所有單關(guān)鍵詞,來判斷通知信息中是否包括其中的一個或者多個目標(biāo)單關(guān)鍵詞;還可以先對通知信息進(jìn)行分詞,進(jìn)而獲取通知信息的特征詞,然后將特征詞與關(guān)鍵詞集中的所有單關(guān)鍵詞進(jìn)行匹配,來判斷通知信息中是否包括關(guān)鍵詞集中的單關(guān)鍵詞。當(dāng)通知信息中包括關(guān)鍵詞集中的單關(guān)鍵詞時,可以確定該單關(guān)鍵詞即為目標(biāo)單關(guān)鍵詞,從而確定通知信息中包括目標(biāo)單關(guān)鍵詞;當(dāng)通知信息中不包括關(guān)鍵詞集中的任意一個單關(guān)鍵詞時,可以確定通知信息不是預(yù)設(shè)類型信息。

為了識別結(jié)果的準(zhǔn)確性,防止誤判,信息識別裝置在確定通知信息中包括目標(biāo)單關(guān)鍵詞之后,還需要確定通知信息中是否包括目標(biāo)組合關(guān)鍵詞。信息識別裝置可以根據(jù)目標(biāo)單關(guān)鍵詞,獲取目標(biāo)組合關(guān)鍵詞。例如,信息識別裝置可以通過在關(guān)鍵詞集的所有組合關(guān)鍵詞中查找目標(biāo)單關(guān)鍵詞的方式,查找出所有包括目標(biāo)單關(guān)鍵詞的組合關(guān)鍵詞,即為目標(biāo)組合關(guān)鍵詞。

S103、將通知信息與目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,獲得匹配結(jié)果;

具體地,在S102之后,信息識別裝置需要將通知信息與通過S102確定出來的每個目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,獲得匹配結(jié)果,其中,匹配結(jié)果可以表明通知信息中包括該目標(biāo)組合關(guān)鍵詞,也可以表明通知信息中不包括該目標(biāo)組合關(guān)鍵詞。

下面,以目標(biāo)單關(guān)鍵詞按照與、或邏輯關(guān)系組成目標(biāo)組合關(guān)鍵詞為例,進(jìn)行說明。

信息識別裝置可以將目標(biāo)組合關(guān)鍵詞中的目標(biāo)單關(guān)鍵詞分為至少一個小組,每個小組中包括至少一個目標(biāo)單關(guān)鍵詞。其中,每個小組中的目標(biāo)單關(guān)鍵詞之間的邏輯關(guān)系為“或”,即只要通知信息中包括該小組中的任意一個目標(biāo)單關(guān)鍵詞,就可以確定通知信息包括該小組。目標(biāo)組合關(guān)鍵詞的小組之間的邏輯關(guān)系為“與”,即當(dāng)通知信息中包括某個目標(biāo)組合關(guān)鍵詞的所有小組時,匹配結(jié)果才可以表明通知信息中包括該目標(biāo)組合關(guān)鍵詞。

例如,關(guān)鍵詞集中,組合關(guān)鍵詞“人壽理財健康車輛保險”中所包括的單關(guān)鍵詞為“人壽”、“理財”、“健康”、“車輛”、“保險”,其中,“人壽”、“理財”、“健康”、“車輛”屬于第一小組,“保險”屬于第二小組。首先,由于第一小組中的“人壽”、“理財”、“健康”、“車輛”的組成關(guān)系為邏輯“或”,因此,通知信息中只要包括“人壽”、“理財”、“健康”、“車輛”中的任意一個單關(guān)鍵詞,則可以表明通知信息中包括第一小組,比如通知信息中包括“人壽”。同時,第一小組與第二小組的組成關(guān)系為邏輯“與”,因此,通知信息中還需要包括第二小組,第二小組中只有單關(guān)鍵詞“保險”,因此,當(dāng)通知信息中還包括“保險”時,可以確定通知信息中包括該組合關(guān)鍵詞“人壽理財健康車輛保險”,該組合關(guān)鍵詞即為目標(biāo)組合關(guān)鍵詞。

這樣一來,僅將通知信息與目標(biāo)組合關(guān)鍵詞進(jìn)行匹配來獲取匹配結(jié)果,而無需如現(xiàn)有技術(shù)一般將通知信息與關(guān)鍵詞集中所有的組合關(guān)鍵詞進(jìn)行匹配來獲得匹配結(jié)果,從而大幅降低了匹配次數(shù),繼而降低了信息識別方法的時間復(fù)雜度,進(jìn)而提高了信息識別方法的效率。

S104、當(dāng)匹配結(jié)果表明通知信息中包括目標(biāo)組合關(guān)鍵詞時,將通知信息確定為預(yù)設(shè)類型信息。

具體的,由于關(guān)鍵詞集中的單關(guān)鍵詞與組合關(guān)鍵詞提取至大量的預(yù)設(shè)類型信息中,因此,當(dāng)通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞和目標(biāo)組合關(guān)鍵詞時,可以較為準(zhǔn)確地確定出通知信息為預(yù)設(shè)類型信息。

可選的,在關(guān)鍵詞集中獲取包括目標(biāo)單關(guān)鍵詞的目標(biāo)組合關(guān)鍵詞時,可以根據(jù)目標(biāo)單關(guān)鍵詞對應(yīng)的位置信息,在關(guān)鍵詞集中獲取目標(biāo)組合關(guān)鍵詞。

示例的,關(guān)鍵詞集中的所有組合關(guān)鍵詞存儲于一個數(shù)組中,數(shù)組的長度表示關(guān)鍵詞集中所有組合關(guān)鍵詞的數(shù)量,數(shù)組中的每個元素對應(yīng)于一個組合關(guān)鍵詞,例如,關(guān)鍵詞集中存儲有10000個組合關(guān)鍵詞,則該數(shù)組的長度為10000。數(shù)組中的每個元素又分為若干單元,其中每個單元對應(yīng)于一個該組合關(guān)鍵詞所包括的單關(guān)鍵詞,例如,組合關(guān)鍵詞“人壽保險”由單關(guān)鍵詞“人壽”、“保險”組成,則第1個單元存儲單關(guān)鍵詞“人壽”,第2個單元存儲單關(guān)鍵詞“保險”。

相應(yīng)的,在存儲單關(guān)鍵詞時,會同時存儲所有包括該單關(guān)鍵詞的組合關(guān)鍵詞的位置信息。例如,包括單關(guān)鍵詞“保險”的組合關(guān)鍵詞“人壽保險”、“保險經(jīng)紀(jì)”分別存儲于組合關(guān)鍵詞數(shù)組中的第1個和第10個。在組合關(guān)鍵詞“人壽保險”所對應(yīng)的數(shù)組元素中,單關(guān)鍵詞“保險”存儲在第2個單元中,同時,在組合關(guān)鍵詞“保險經(jīng)紀(jì)”所對應(yīng)的數(shù)組元素中,單關(guān)鍵詞“保險”存儲在第1個單元中,因此,可以將包括單關(guān)鍵詞“保險”的組合關(guān)鍵詞的位置信息,以二維坐標(biāo)的方式記為(1,2)、(10,1)。因此,當(dāng)確定單關(guān)鍵詞“保險”為目標(biāo)單關(guān)鍵詞之后,可以根據(jù)“保險”的位置信息(1,2)、(10,1),獲取關(guān)鍵詞集中組合關(guān)鍵詞數(shù)組中的第1個和第10個元素所對應(yīng)的組合關(guān)鍵詞作為目的組合關(guān)鍵詞。

可選的,在確定通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞之前,可以首先獲取首字符相同的單關(guān)鍵詞;然后,按照的大小順序,將單關(guān)鍵詞存儲至關(guān)鍵詞集中。

示例的,可以首先計算單關(guān)鍵詞首字符的字符編碼的哈希值,然后獲取哈希值相同的單關(guān)鍵詞,作為首字符相同的單關(guān)鍵詞。接下來,在首字符相同的單關(guān)鍵詞中,計算單關(guān)鍵詞所有字符的字符編碼的哈希值,作為單關(guān)鍵詞的特征值,并按照單關(guān)鍵詞特征值的字典排序,將單關(guān)鍵詞存儲至關(guān)鍵詞集中。例如,首字符相同的單關(guān)鍵詞的特征值分別為“abf”、“abc”、“add2”、“ada”、“add1”,則按照字典排序,上述特征值的順序為:“abc”、“abf”、“ada”、“add1”、“add2”。

可選的,在確定通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞時,可以首先通過對通知信息進(jìn)行分詞,獲取通知信息的特征詞;然后,在關(guān)鍵詞集中查找出與特征詞的首字符相同的單關(guān)鍵詞;繼而,根據(jù)單關(guān)鍵詞的存儲順序,依次比較特征詞的特征值與單關(guān)鍵詞的特征值;接下來,當(dāng)在單關(guān)鍵詞中確定出目標(biāo)單關(guān)鍵詞時,確定通知信息中包括目標(biāo)單關(guān)鍵詞,其中,目標(biāo)單關(guān)鍵詞為與特征詞的特征值相等的單關(guān)鍵詞。

示例的,可以通過分詞技術(shù)對通知信息進(jìn)行分詞,獲取通知信息的特征詞,其中,分詞技術(shù)包括字符串匹配分詞法、詞義分詞法、統(tǒng)計分詞法等。然后,計算特征詞首字符的字符編碼的哈希值。繼而,在關(guān)鍵詞集中獲取與特征詞的哈希值相同的單關(guān)鍵詞,作為首字符與特征詞的首字符相同的單關(guān)鍵詞。例如,首字符與特征詞的首字符相同的單關(guān)鍵詞的存儲順序為:“abc”、“abf”、“ada”、“add1”、“add2”,這里,使用每個單關(guān)鍵詞的特征值來表示該單關(guān)鍵詞,可以看出特征值“abc”、“abf”、“ada”、“add1”、“add2”按照字典排序進(jìn)行排列。然后,計算特征詞所有字符的字符編碼的哈希值,作為特征詞的特征值,例如,特征詞的特征值為“abe”。接下來,按照字典排序的規(guī)則,依次比較“abe”與“abc”、“abf”、“ada”、“add1”、“add2”的大小,來查找特征值與“abe”相等的單關(guān)鍵詞。首先,比較“abe”與“abc”的大小,由于“abe”大于“abc”,因此,需要繼續(xù)比較“abe”與“abf”,由于“abe”小于“abf”,說明存儲在“abf”之后的特征詞“ada”、“add1”、“add2”均大于“abe”,從而可以確定不存在特征值與“abe”相等的單關(guān)鍵詞,繼而確定通知信息中不包括目標(biāo)單關(guān)鍵詞,因此無需繼續(xù)比較“abe”與“ada”、“add1”、“add2”的大小。

這樣一來,在首字符相同的單關(guān)鍵詞中,按照單關(guān)鍵詞的存儲順序,依次匹配特征詞與單關(guān)鍵詞,當(dāng)可以確定不存在與特征詞匹配的單關(guān)鍵詞時,無需繼續(xù)遍歷剩余的單關(guān)鍵詞,從而減少了匹配次數(shù),繼而降低了信息識別方法的時間復(fù)雜度,進(jìn)而提高了信息識別方法的效率。

可選的,在接收通知信息之后,且在確定通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞之前,可以首先讀取與通知信息所屬業(yè)務(wù)對應(yīng)的關(guān)鍵詞集。

示例的,為了提高信息識別方法的效率,可以按照通知信息所屬業(yè)務(wù)的不同,采用分布式識別模塊對通知信息進(jìn)行識別,同時,不同的業(yè)務(wù)所對應(yīng)的關(guān)鍵詞集也可以采用分布式存儲。以通知信息是短信為例進(jìn)行說明,來自同一個手機(jī)號碼的短信可以對應(yīng)于一種業(yè)務(wù),或者,來自相同歸屬地手機(jī)號碼的短信可以對應(yīng)于一種業(yè)務(wù)。

較佳的,通知信息中可以包括識別模塊標(biāo)識以及關(guān)鍵詞集標(biāo)識,所屬業(yè)務(wù)相同的通知信息具有相同的識別模塊標(biāo)識以及關(guān)鍵詞集標(biāo)識,其中識別模塊標(biāo)識用于指示對通知信息進(jìn)行識別的分布式識別模塊的標(biāo)號,關(guān)鍵詞集標(biāo)識用于指示分布式識別模塊需要讀取的關(guān)鍵詞集的標(biāo)號。

例如,來自歸屬地為北京的手機(jī)號碼的短信中的識別模塊標(biāo)識為1或2,則表明需要使用標(biāo)號為1或2的分布式識別模塊對短信進(jìn)行識別,因此,標(biāo)號為1的分布式識別模塊會接收到該短信并對該短信進(jìn)行識別,如果標(biāo)號為1的分布式識別模塊處于異常狀態(tài),例如,處于斷電或死機(jī)狀態(tài),則標(biāo)號為2的分布式識別模塊會接收到該短信并對該短信進(jìn)行識別,從而為短信的即時識別提供了保障。本實施例以標(biāo)號為1的分布式識別模塊接收并識別該短信為例進(jìn)行說明。假設(shè)短信中的關(guān)鍵詞集標(biāo)識為1和3,則標(biāo)號為1的分布式識別模塊在接收該短信之后,會首先讀取標(biāo)號為1和標(biāo)號為3的關(guān)鍵詞集,然后,在標(biāo)號為1和標(biāo)號為3的關(guān)鍵詞集中確定該短信中是否包括目標(biāo)單關(guān)鍵詞和目標(biāo)組合關(guān)鍵詞。當(dāng)該短信中包括目標(biāo)單關(guān)鍵詞和目標(biāo)組合關(guān)鍵詞時,將該短信確定為預(yù)設(shè)類型信息。

這樣一來,按照通知信息所屬業(yè)務(wù)的不同,采用分布式識別模塊對通知信息進(jìn)行識別,使得可以通過不同的分布式識別模塊,對不同的通知信息進(jìn)行識別,有效利用了硬件資源,提高了信息識別方法的效率。同時,不同的業(yè)務(wù)所對應(yīng)的關(guān)鍵詞集也采用分布式存儲,可以使得所屬同種業(yè)務(wù)的通知信息在該種業(yè)務(wù)所對應(yīng)的關(guān)鍵詞集中進(jìn)行匹配,避免了通知信息與其它業(yè)務(wù)所對應(yīng)的關(guān)鍵詞進(jìn)行匹配,不僅提高了匹配效率,還可以防止其它業(yè)務(wù)所對應(yīng)的關(guān)鍵詞對于識別該種業(yè)務(wù)的通知信息時所形成的干擾,提高識別的準(zhǔn)確性。

本發(fā)明實施例提供了一種信息識別的方法與裝置,首先接收通知信息;然后在確定通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞之后,在關(guān)鍵詞集中獲取包括目標(biāo)單關(guān)鍵詞的目標(biāo)組合關(guān)鍵詞;接下來,僅將通知信息與目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,并獲得匹配結(jié)果;繼而,當(dāng)匹配結(jié)果表明通知信息中包含目標(biāo)組合關(guān)鍵詞時,將通知信息確定為預(yù)設(shè)類型信息。而無需如現(xiàn)有技術(shù)一般將通知信息與關(guān)鍵詞集中所有的組合關(guān)鍵詞進(jìn)行匹配來獲得匹配結(jié)果,從而大幅降低了匹配次數(shù),繼而降低了信息識別的時間復(fù)雜度,進(jìn)而提高了信息識別的效率。

實施例二

本發(fā)明實施例提供了一種信息識別的方法,應(yīng)用于具有信息處理能力的裝置,如終端、服務(wù)器、網(wǎng)絡(luò)監(jiān)控器等,如圖2所示,上述信息識別方法,包括:

S201、獲取首字符相同的單關(guān)鍵詞;

示例的,可以首先計算單關(guān)鍵詞首字符的GB2312(信息交換用漢字編碼字符集)編碼的哈希值,然后獲取哈希值相同的單關(guān)鍵詞即為首字符相同的單關(guān)鍵詞。

S202、獲取單關(guān)鍵詞的特征值;

示例的,可以計算單關(guān)鍵詞所有字符的GB2312編碼的哈希值,作為單關(guān)鍵詞的特征值;也可以計算單關(guān)鍵詞預(yù)設(shè)字符的GB2312編碼的哈希值,作為單關(guān)鍵詞的特征值,在實際應(yīng)用中,預(yù)設(shè)字符可以根據(jù)具體情況進(jìn)行設(shè)置,本發(fā)明實施例對此不做限定。

S203、按照單關(guān)鍵詞的特征值的大小順序,將單關(guān)鍵詞以及單關(guān)鍵詞所對應(yīng)的位置信息存儲至關(guān)鍵詞集中;

這里,單關(guān)鍵詞所對應(yīng)的位置信息,用于指示包括單關(guān)鍵詞的組合關(guān)鍵詞在關(guān)鍵詞集中的位置。

示例的,可以按照單關(guān)鍵詞的特征值的字典排序,將單關(guān)鍵詞以及單關(guān)鍵詞所對應(yīng)的位置信息存儲至關(guān)鍵詞集中。

S204、接收通知信息;

示例的,通知信息可以是終端接收到的短信、微信等信息,也可以是網(wǎng)絡(luò)裝置接收到的用于裝置之間進(jìn)行通信的信息。

S205、讀取與通知信息所屬業(yè)務(wù)對應(yīng)的關(guān)鍵詞集;

示例的,可以根據(jù)通知信息中的關(guān)鍵詞集標(biāo)識,讀取與通知信息所屬業(yè)務(wù)對應(yīng)的關(guān)鍵詞集。

S206、通過對通知信息進(jìn)行分詞,獲取通知信息的特征詞;

示例的,可以通過分詞技術(shù)對通知信息進(jìn)行分詞,獲取通知信息的特征詞,其中分詞技術(shù)包括字符串匹配分詞法、詞義分詞法、統(tǒng)計分詞法等。

S207、在關(guān)鍵詞集中查找出與特征詞的首字符相同的單關(guān)鍵詞;

具體的,需要首先在關(guān)鍵詞集中查找是否存在首字符與特征詞的首字符相同的單關(guān)鍵詞;當(dāng)在關(guān)鍵詞集中查找出首字符與特征詞的首字符相同的單關(guān)鍵詞時,表明通知信息中可能包括關(guān)鍵詞集中的單關(guān)鍵詞,還需要在查找出的單關(guān)鍵詞中進(jìn)行進(jìn)一步判斷;當(dāng)在關(guān)鍵詞集中沒有查找出首字符與特征詞的首字符相同的單關(guān)鍵詞時,表明通知信息中不包括關(guān)鍵詞集中的單關(guān)鍵詞。

S208、比較特征詞的特征值與第i個單關(guān)鍵詞的特征值的大小;當(dāng)特征詞的特征值大于第i個單關(guān)鍵詞的特征值時,執(zhí)行S209;當(dāng)特征詞的特征值等于第i個單關(guān)鍵詞的特征值時,執(zhí)行S210;當(dāng)特征詞的特征值小于第i個單關(guān)鍵詞的特征值時,執(zhí)行S204;

這里,i為大于或等于1的整數(shù)。

示例的,單關(guān)鍵詞按照字典排序進(jìn)行存儲,即單關(guān)鍵詞按照從小到大的順序進(jìn)行存儲,因此,當(dāng)特征詞的特征值大于第i個單關(guān)鍵詞的特征值時,說明特征值有可能與特征詞的特征值相等的單關(guān)鍵詞位于第i個單關(guān)鍵詞之后,應(yīng)該繼續(xù)比較特征詞的特征值與下一個單關(guān)鍵詞的特征值的大?。划?dāng)特征詞的特征值等于第i個單關(guān)鍵詞的特征值時,說明特征詞與第i個單關(guān)鍵詞相同,可以確定第i個單關(guān)鍵詞為目標(biāo)單關(guān)鍵詞,從而確定通知信息中包括目標(biāo)單關(guān)鍵詞;當(dāng)特征詞的特征值小于第i個單關(guān)鍵詞的特征值時,由于排在第i個單關(guān)鍵詞之后的單關(guān)鍵詞的特征值均大于第i個單關(guān)鍵詞的特征值,從而說明排在第i個單關(guān)鍵詞之后的單關(guān)鍵詞的特征值均大于特征詞的特征值,因此,可以確定排在第i個單關(guān)鍵詞之后的單關(guān)鍵詞中不存在與特征詞相同的單關(guān)鍵詞,進(jìn)而可以確定通知信息中不包括目標(biāo)單關(guān)鍵詞,應(yīng)該停止繼續(xù)比較特征詞的特征值與下一個單關(guān)鍵詞的特征值的大小,從而可以降低比較的次數(shù),提高信息識別方法的效率。

S209、將i+1的值賦給i,返回S208;

這里,第i+1個單關(guān)鍵詞為在單關(guān)鍵詞的存儲順序中,位于第i個單關(guān)鍵詞之后的下一個單關(guān)鍵詞。

S210、確定第i個單關(guān)鍵詞即為目標(biāo)單關(guān)鍵詞,從而確定通知信息中包括目標(biāo)單關(guān)鍵詞;

具體的,當(dāng)特征詞的特征值等于第i個單關(guān)鍵詞的特征值時,說明特征詞與第i個單關(guān)鍵詞相同,可以確定第i個單關(guān)鍵詞為目標(biāo)單關(guān)鍵詞,從而確定通知信息中包括目標(biāo)單關(guān)鍵詞。

S211、根據(jù)目標(biāo)單關(guān)鍵詞對應(yīng)的位置信息,在關(guān)鍵詞集中獲取目標(biāo)組合關(guān)鍵詞;

示例的,組合關(guān)鍵詞可以按照在關(guān)鍵詞集中的標(biāo)號進(jìn)行存儲,相應(yīng)的,單關(guān)鍵詞對應(yīng)的位置信息為所有的包括該單關(guān)鍵詞的組合關(guān)鍵詞在關(guān)鍵詞集中的標(biāo)號。例如,目標(biāo)單關(guān)鍵詞對應(yīng)的位置信息為1和10,則可以在關(guān)鍵詞集中獲取標(biāo)號為1的組合關(guān)鍵詞和標(biāo)號為10的組合關(guān)鍵詞,作為目標(biāo)組合關(guān)鍵詞。

S212、將通知信息與目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,獲得匹配結(jié)果;

具體的,匹配結(jié)果可以表明通知信息中包括目標(biāo)組合關(guān)鍵詞,也可以表明通知信息中不包括目標(biāo)組合關(guān)鍵詞。

S213、當(dāng)匹配結(jié)果表明通知信息中包括目標(biāo)組合關(guān)鍵詞時,將通知信息確定為預(yù)設(shè)類型信息。

具體的,當(dāng)通知信息既包括目標(biāo)單關(guān)鍵詞又包括目標(biāo)組合關(guān)鍵詞時,可以較為準(zhǔn)確地將通知信息確定為預(yù)設(shè)類型信息。

需要說明的是,本發(fā)明實施例提供的信息識別方法步驟的先后順序可以進(jìn)行適當(dāng)調(diào)整,步驟也可以根據(jù)情況進(jìn)行相應(yīng)增減,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化的方法,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi),因此不再贅述。

本發(fā)明實施例提供了一種信息識別的方法,首先接收通知信息;然后在確定通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞之后,在關(guān)鍵詞集中獲取包括目標(biāo)單關(guān)鍵詞的目標(biāo)組合關(guān)鍵詞;接下來,僅將通知信息與目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,并獲得匹配結(jié)果;繼而,當(dāng)匹配結(jié)果表明通知信息中包含目標(biāo)組合關(guān)鍵詞時,將通知信息確定為預(yù)設(shè)類型信息。而無需如現(xiàn)有技術(shù)一般將通知信息與關(guān)鍵詞集中所有的組合關(guān)鍵詞進(jìn)行匹配來獲得匹配結(jié)果,從而大幅降低了匹配次數(shù),繼而降低了信息識別的時間復(fù)雜度,進(jìn)而提高了信息識別的效率。

實施例三

本發(fā)明實施例提供了一種信息識別裝置,參見圖3所示,裝置30包括:接收單元301,用于接收通知信息;匹配單元302,用于在確定通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞之后,在關(guān)鍵詞集中獲取包括目標(biāo)單關(guān)鍵詞的目標(biāo)組合關(guān)鍵詞;將通知信息與目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,獲得匹配結(jié)果;確定單元303,用于當(dāng)匹配結(jié)果表明通知信息中包括目標(biāo)組合關(guān)鍵詞時,將通知信息確定為預(yù)設(shè)類型信息。

可選的,匹配單元302,具體用于根據(jù)目標(biāo)單關(guān)鍵詞對應(yīng)的位置信息,在關(guān)鍵詞集中獲取目標(biāo)組合關(guān)鍵詞。

可選的,參見圖4所示,裝置30還包括:獲取單元304,用于獲取首字符相同的單關(guān)鍵詞;存儲單元305,用于按照單關(guān)鍵詞的特征值的大小順序,將單關(guān)鍵詞存儲至關(guān)鍵詞集中。

可選的,匹配單元302,具體用于通過對通知信息進(jìn)行分詞,獲取通知信息的特征詞;在關(guān)鍵詞集中查找出與特征詞的首字符相同的單關(guān)鍵詞;根據(jù)單關(guān)鍵詞的存儲順序,依次比較特征詞的特征值與單關(guān)鍵詞的特征值;當(dāng)在單關(guān)鍵詞中確定出目標(biāo)單關(guān)鍵詞時,確定通知信息中包括目標(biāo)單關(guān)鍵詞,其中,目標(biāo)單關(guān)鍵詞為與特征詞的特征值相等的單關(guān)鍵詞。

可選的,匹配單元302,還用于在確定通知信息中包括目標(biāo)單關(guān)鍵詞之前,讀取與通知信息所屬業(yè)務(wù)對應(yīng)的關(guān)鍵詞集。

需要說明的是,第一,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。

第二,在實際應(yīng)用中,匹配單元302、確定單元303、獲取單元304、存儲單元305均可由位于裝置30中的中央處理器(Central Processing Unit,CPU)、微處理器(Micro Processor Unit,MPU)、數(shù)字信號處理器(Digital Signal Processor,DSP)、或現(xiàn)場可編程門陣列(Field Programmable Gate Array,F(xiàn)PGA)等實現(xiàn)。接收單元301可由位于裝置30中的天線、天線的驅(qū)動電路以及又由各種光電接收設(shè)備或端口來實現(xiàn)。

本發(fā)明實施例提供了一種信息識別裝置,包括:接收單元,用于接收通知信息;匹配單元,用于在確定通知信息中包括關(guān)鍵詞集中的目標(biāo)單關(guān)鍵詞之后,在關(guān)鍵詞集中獲取包括目標(biāo)單關(guān)鍵詞的目標(biāo)組合關(guān)鍵詞;將通知信息與目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,獲得匹配結(jié)果;確定單元,用于當(dāng)匹配結(jié)果表明通知信息中包括目標(biāo)組合關(guān)鍵詞時,將通知信息確定為預(yù)設(shè)類型信息。相較于現(xiàn)有技術(shù),通知信息僅與目標(biāo)組合關(guān)鍵詞進(jìn)行匹配,而無需與關(guān)鍵詞集中所有的組合關(guān)鍵詞進(jìn)行匹配,從而大幅降低了匹配次數(shù),繼而降低了信息識別的時間復(fù)雜度,進(jìn)而提高了信息識別的效率。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用硬件實施例、軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實施的計算機(jī)程序產(chǎn)品的形式。

本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。

這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。

這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。

以上所述,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1