日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種藥品名稱(chēng)數(shù)據(jù)匹配方法和裝置制造方法

文檔序號(hào):6507352閱讀:380來(lái)源:國(guó)知局
一種藥品名稱(chēng)數(shù)據(jù)匹配方法和裝置制造方法
【專(zhuān)利摘要】本申請(qǐng)?zhí)峁┝艘环N藥品名稱(chēng)數(shù)據(jù)匹配方法,包括:獲取藥品名稱(chēng)數(shù)據(jù);根據(jù)預(yù)置字典對(duì)所述藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞生成藥品名稱(chēng)標(biāo)注數(shù)據(jù);所述預(yù)置字典至少包括:前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù);對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)通過(guò)比較算法生成相同藥品名稱(chēng)數(shù)據(jù)組。本發(fā)明實(shí)施例還提供了對(duì)應(yīng)的裝置,本發(fā)明實(shí)施例通過(guò)預(yù)置字典對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞,將分詞獲得的藥品名稱(chēng)標(biāo)注數(shù)據(jù)進(jìn)行比較計(jì)算,以獲取相同名稱(chēng)數(shù)據(jù)組,提高了相同藥品名稱(chēng)數(shù)據(jù)獲取的成功率,減少了計(jì)算量。
【專(zhuān)利說(shuō)明】—種藥品名稱(chēng)數(shù)據(jù)匹配方法和裝置

【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及數(shù)據(jù)匹配【技術(shù)領(lǐng)域】,特別是涉及一種藥品名稱(chēng)數(shù)據(jù)匹配方法和裝置。

【背景技術(shù)】
[0002]在醫(yī)藥行業(yè)中,存在大量的醫(yī)藥名稱(chēng),可能同一類(lèi)型的藥因?yàn)閯┝?、藥名等?xì)微的差異會(huì)產(chǎn)生大量數(shù)據(jù),事實(shí)上企業(yè)很難確保其所積累數(shù)據(jù)的質(zhì)量,其原因是多種多樣的,如:錄入錯(cuò)誤、完整性約束缺失、信息的多種描述方式等。在一些醫(yī)藥批發(fā)等類(lèi)似行業(yè)中,需要對(duì)藥品的名稱(chēng)進(jìn)行確切識(shí)別,以方便用戶(hù)獲知同類(lèi)型藥品。
[0003]為了解決上述應(yīng)用中的問(wèn)題,現(xiàn)有技術(shù)提出一種記錄匹配方法,主要包括:首先對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞獲取名稱(chēng)詞;然后將相近名稱(chēng)詞的藥品名稱(chēng)數(shù)據(jù)經(jīng)過(guò)比較算法獲得相同名稱(chēng)數(shù)據(jù)組展示給操作員?,F(xiàn)有技術(shù)中利用開(kāi)源的分詞工具對(duì)藥品名稱(chēng)進(jìn)行分詞,對(duì)于常見(jiàn)的如“小兒復(fù)方賴(lài)氨酸顆?!贝_實(shí)可以分為“小兒I復(fù)方I賴(lài)氨酸I顆?!保墒菍?duì)于“注射用阿莫西林鈉”這種不常見(jiàn)的藥品名稱(chēng),其分詞結(jié)果為“注射用I阿莫西林I鈉”將原本是一種化學(xué)物質(zhì)(阿莫西林鈉)分成了兩種化學(xué)物質(zhì)的組合(阿莫西林I鈉)。這種情況將導(dǎo)致“阿莫西林”與“阿莫西林鈉”這兩種化學(xué)物質(zhì)混淆,影響最終的比較結(jié)果。
[0004]在現(xiàn)有的技術(shù)方案中,由于在分詞過(guò)程中多半采用固定分詞方式難以獲取針對(duì)藥品名稱(chēng)數(shù)據(jù)精確的特征詞,以至于無(wú)法精確比較,無(wú)法完成對(duì)藥品名稱(chēng)數(shù)據(jù)的相同類(lèi)型確定。


【發(fā)明內(nèi)容】

[0005]本申請(qǐng)所要解決的技術(shù)問(wèn)題是提供一種藥品名稱(chēng)數(shù)據(jù)匹配方法和裝置,能夠針對(duì)藥品名稱(chēng)更快的提供相同藥品名稱(chēng)數(shù)據(jù)組。
[0006]為了解決上述問(wèn)題,本申請(qǐng)公開(kāi)了一種藥品名稱(chēng)數(shù)據(jù)匹配方法,包括:
[0007]獲取藥品名稱(chēng)數(shù)據(jù);
[0008]根據(jù)預(yù)置字典對(duì)所述藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞生成藥品名稱(chēng)標(biāo)注數(shù)據(jù);所述預(yù)置字典至少包括:前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù);
[0009]對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)通過(guò)比較算法生成相同藥品名稱(chēng)數(shù)據(jù)組。
[0010]進(jìn)一步,所述根據(jù)預(yù)置字典對(duì)所述藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞生成藥品名稱(chēng)標(biāo)注數(shù)據(jù)包括:
[0011]根據(jù)預(yù)置字典中包含的前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù)對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞,形成的藥品名稱(chēng)標(biāo)注數(shù)據(jù)包括前綴詞、成分詞、藥效詞和劑型詞。
[0012]進(jìn)一步,所述對(duì)藥品名稱(chēng)標(biāo)注數(shù)據(jù)通過(guò)比較算法生成相同藥品名稱(chēng)數(shù)據(jù)組包括:
[0013]根據(jù)預(yù)置固定比較算法對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)中的前綴詞、成分詞、藥效詞和劑型詞計(jì)算相似度,當(dāng)所述相似度超過(guò)閾值的藥品名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)判定為相同名稱(chēng)數(shù)據(jù)組。
[0014]進(jìn)一步,所述根據(jù)預(yù)置固定比較算法對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)中的前綴詞、成分詞、藥效詞和劑型詞進(jìn)行比較計(jì)算包括:
[0015]計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的前綴詞、劑型詞和其他后綴詞相似度,當(dāng)所述相似度達(dá)到或超過(guò)預(yù)定閾值,且判斷其中一個(gè)藥品標(biāo)注數(shù)據(jù)中的其他識(shí)別詞與另一個(gè)藥品名稱(chēng)中的成分詞或藥效詞或其他識(shí)別詞通過(guò)拼音模糊匹配合格,則判定所述兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)是模糊相同。
[0016]進(jìn)一步,所述根據(jù)預(yù)置固定比較算法對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)中的前綴詞、成分詞、藥效詞和劑型詞進(jìn)行比較計(jì)算包括:
[0017]計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的成分詞和藥效詞相似度,當(dāng)所述相似度為完全相同時(shí),判定所述兩個(gè)藥瓶名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)為相同名稱(chēng)數(shù)據(jù)組。
[0018]本申請(qǐng)還提供了一種藥品名稱(chēng)數(shù)據(jù)匹配裝置,包括:
[0019]獲取模塊,用于獲取藥品名稱(chēng)數(shù)據(jù);
[0020]分詞模塊,用于根據(jù)預(yù)置字典對(duì)所述藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞生成藥品名稱(chēng)標(biāo)注數(shù)據(jù);所述預(yù)置字典至少包括:前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù);
[0021]比較模塊,用于對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)通過(guò)比較算法生成相同藥品名稱(chēng)數(shù)據(jù)組。
[0022]進(jìn)一步,所述分詞模塊用于:
[0023]根據(jù)預(yù)置字典中包含的前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù)對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞,所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)至少包括前綴詞、成分詞、藥效詞和劑型詞。
[0024]進(jìn)一步,所述比較模塊用于:
[0025]根據(jù)預(yù)置固定比較算法對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)中的前綴詞、成分詞、藥效詞和劑型詞計(jì)算相似度,當(dāng)所述相似度超過(guò)閾值的藥品名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)判定為相同名稱(chēng)數(shù)據(jù)組。
[0026]進(jìn)一步,所述比較模塊用于:
[0027]計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的前綴詞、劑型詞和其他后綴詞相似度,當(dāng)所述相似度達(dá)到或超過(guò)預(yù)定閾值,且判斷其中一個(gè)藥品標(biāo)注數(shù)據(jù)中的其他識(shí)別詞與另一個(gè)藥品名稱(chēng)中的成分詞或藥效詞或其他識(shí)別詞通過(guò)拼音模糊匹配合格,則判定所述兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)是模糊相同。
[0028]進(jìn)一步,所比較模塊用于:
[0029]計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的成分詞和藥效詞相似度,當(dāng)所述相似度為完全相同時(shí),判定所述兩個(gè)藥瓶名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)為相同名稱(chēng)數(shù)據(jù)組。
[0030]與現(xiàn)有技術(shù)相比,本申請(qǐng)包括以下優(yōu)點(diǎn):通過(guò)預(yù)置字典對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞,將分詞獲得的藥品名稱(chēng)標(biāo)注數(shù)據(jù)進(jìn)行比較計(jì)算,以獲取相同名稱(chēng)數(shù)據(jù)組,提高了相同藥品名稱(chēng)數(shù)據(jù)獲取的成功率,減少了計(jì)算量。

【專(zhuān)利附圖】

【附圖說(shuō)明】
[0031]圖1是本發(fā)明一種藥品名稱(chēng)數(shù)據(jù)匹配方法一實(shí)施例的流程圖;
[0032]圖2是本發(fā)明一種藥品名稱(chēng)數(shù)據(jù)匹配方法一實(shí)施例中字典完善流程;
[0033]圖3是本發(fā)明一種藥品名稱(chēng)數(shù)據(jù)匹配方法一實(shí)施例中分詞示意圖;
[0034]圖4是本發(fā)明一種藥品名稱(chēng)數(shù)據(jù)匹配裝置一實(shí)施例的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0035]為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說(shuō)明。
[0036]參照?qǐng)D1,示出了本申請(qǐng)一種藥品名稱(chēng)數(shù)據(jù)匹配方法。
[0037]現(xiàn)有的藥品名稱(chēng)數(shù)據(jù)的匹配方法中,針對(duì)分詞步驟主要利用開(kāi)源的分詞工具對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞,由于藥品名稱(chēng)數(shù)據(jù)的特殊性和開(kāi)源的分詞工具并不具備完整字典(相對(duì)于藥品名稱(chēng)來(lái)說(shuō)),因此通過(guò)常見(jiàn)開(kāi)源的分詞工具進(jìn)行分詞獲取的藥品名稱(chēng)標(biāo)注數(shù)據(jù)并不精確,因此,一個(gè)相對(duì)于藥品名稱(chēng)來(lái)說(shuō)完整的字典對(duì)于藥品名稱(chēng)的識(shí)別是至關(guān)重要的。在本發(fā)明實(shí)施例中將公開(kāi)一種藥品名稱(chēng)數(shù)據(jù)匹配方法。包括:
[0038]步驟S101、獲取藥品名稱(chēng)數(shù)據(jù);
[0039]本發(fā)明實(shí)施例可以直接從現(xiàn)有保存藥品名稱(chēng)數(shù)據(jù)的數(shù)據(jù)庫(kù)中獲取藥品名稱(chēng)數(shù)據(jù)。
[0040]步驟S102、根據(jù)預(yù)置字典對(duì)所述藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞生成藥品名稱(chēng)標(biāo)注數(shù)據(jù);所述預(yù)置字典至少包括:前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù)。
[0041]在本發(fā)明實(shí)施例中預(yù)置的字典中針對(duì)藥品名稱(chēng)數(shù)據(jù)提供了至少四個(gè)字庫(kù),包括前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù);四個(gè)字庫(kù)中分別保存了盡量多的同類(lèi)型的詞,其中對(duì)四個(gè)類(lèi)型的詞區(qū)別如下:
[0042]前綴詞:在藥品名稱(chēng)數(shù)據(jù)中存在特殊的前綴信息,如“復(fù)方甘草片”這個(gè)藥品名稱(chēng)中的“復(fù)方”就是體現(xiàn)規(guī)格的前綴、“小兒清熱寧顆?!敝械摹靶骸本褪求w現(xiàn)適用對(duì)象的前綴,這些前綴詞在藥品名稱(chēng)中確實(shí)擔(dān)任重要作用,但在識(shí)別不同藥品名稱(chēng)的時(shí)候容易造成混淆,如“小兒復(fù)方賴(lài)氨酸顆?!?、“小兒復(fù)方金銀花顆?!眱蓚€(gè)名稱(chēng)相同的前綴詞與劑型詞很容易造成機(jī)器識(shí)別時(shí)候的混淆,因此在本發(fā)明實(shí)施例中將類(lèi)似的前綴信息詞提取出來(lái)做特殊處理。
[0043]成分詞:在藥品名稱(chēng)數(shù)據(jù)中,存在標(biāo)識(shí)藥品的成分詞,這些詞往往具有較強(qiáng)的辨識(shí)度,如“小兒復(fù)方賴(lài)氨酸顆?!薄ⅰ靶簭?fù)方金銀花顆?!眱蓚€(gè)名稱(chēng)中雖然相同的字很多,可是真正具有標(biāo)識(shí)藥品作用的成分詞“賴(lài)氨酸”、“金銀花”卻是不同的,因此使用成分詞是為了更好的識(shí)別藥品名稱(chēng),通用化的記錄匹配算法并不具備這種能力。
[0044]藥效詞:有的藥品名稱(chēng)命名時(shí)并不是使用藥品的成分,而是利用藥品的功效來(lái)命名的,如“感冒清熱顆?!敝械摹案忻扒鍩帷本褪怯脕?lái)表征該藥物的藥效,而且藥物名稱(chēng)數(shù)據(jù)中的藥效詞具有較強(qiáng)的辨識(shí)度(如同成分詞),可以用來(lái)識(shí)別藥品名稱(chēng)。
[0045]劑型詞:在藥品名稱(chēng)數(shù)據(jù)中存在體現(xiàn)劑型特征的詞,稱(chēng)之為劑型詞,這些詞具有特殊的識(shí)別作用:1.利用該詞可以獲知藥品的劑型信息;2.能夠輔助識(shí)別藥品名稱(chēng)中的成分,如“阿莫西林膠囊”中“膠囊”是藥品名稱(chēng)的劑型詞,前面的“阿莫西林”則是藥品名稱(chēng)中的成分詞。
[0046]參照?qǐng)D2,利用字典對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞時(shí),可以將字典導(dǎo)入到分詞工具中獲得所有不存在于字典中的字串(連續(xù)未識(shí)別字的片段),產(chǎn)生未識(shí)別詞的文檔,將該文檔提交給操作員對(duì)未識(shí)別詞進(jìn)行分詞標(biāo)注;其標(biāo)注信息包括:劑型詞、其他后綴詞、前綴詞、藥效詞、成分詞、其他識(shí)別詞??梢栽谔幚硪欢康臄?shù)據(jù)(建議初識(shí)時(shí)為200后續(xù)迭代逐步增多)后,將新標(biāo)注的詞加入到字典中,利用新的字典重新對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞,重復(fù)該過(guò)程即可得到最終的字典。
[0047]由于藥品名稱(chēng)詞中往往存在錯(cuò)誤的拼寫(xiě)(即使藥監(jiān)局的數(shù)據(jù)中同樣存在),因此有必要將常見(jiàn)的錯(cuò)誤拼寫(xiě)組成別名表如:藥監(jiān)局網(wǎng)站上可以同時(shí)查到“呋噻米片”和“呋塞米片”,即在業(yè)務(wù)系統(tǒng)中同時(shí)使用“呋噻米”和“呋塞米”指代同一種化學(xué)物質(zhì)。該別名表可以隨著對(duì)未識(shí)別詞人工分詞標(biāo)注的過(guò)程相應(yīng)獲得,不再詳細(xì)描述該過(guò)程。
[0048]步驟S103、對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)通過(guò)比較算法生成相同藥品名稱(chēng)數(shù)據(jù)組。
[0049]進(jìn)一步,所述根據(jù)預(yù)置字典對(duì)所述藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞生成藥品名稱(chēng)標(biāo)注數(shù)據(jù)包括:
[0050]根據(jù)預(yù)置字典中包含的前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù)對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞,形成的藥品名稱(chēng)標(biāo)注數(shù)據(jù)包括前綴詞、成分詞、藥效詞和劑型詞。
[0051]進(jìn)一步,所述對(duì)藥品名稱(chēng)標(biāo)注數(shù)據(jù)通過(guò)比較算法生成相同藥品名稱(chēng)數(shù)據(jù)組包括:
[0052]根據(jù)預(yù)置固定比較算法對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)中的前綴詞、成分詞、藥效詞和劑型詞計(jì)算相似度,當(dāng)所述相似度超過(guò)閾值的藥品名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)判定為相同名稱(chēng)數(shù)據(jù)組。
[0053]將待比較的兩個(gè)藥品名稱(chēng)數(shù)據(jù)利用上述字典對(duì)其分詞,參照?qǐng)D3,獲得藥品名稱(chēng)的藥品名稱(chēng)標(biāo)注數(shù)據(jù),所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)可以標(biāo)注“前綴詞”、“成分詞”、“藥效詞”、“其他識(shí)別詞”、“劑型詞”、“其他后綴詞”這樣的信息,然后將兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)分別在對(duì)應(yīng)標(biāo)注信息上進(jìn)行比較,只有在各標(biāo)注信息上都達(dá)成一致才能算作是名稱(chēng)相同,若兩個(gè)藥品名稱(chēng)的相似度為0-1的相似。在“前綴詞”對(duì)應(yīng)的兩組詞上,完全相同則一致,否則不一致。在“成分詞”對(duì)應(yīng)的兩組詞上,要利用別名表作為參照,如果完全相同或?qū)儆趧e名關(guān)系則成分詞一致,否則不一致。在“劑型詞”上判斷一致的方式與成分詞類(lèi)似,需要參考劑型詞與劑型信息的對(duì)應(yīng)關(guān)系?!八幮г~”、“其他識(shí)別詞”、“其他后綴詞”的內(nèi)容識(shí)別方式與“前綴詞”識(shí)別方式一致。
[0054]進(jìn)一步,所述根據(jù)預(yù)置固定比較算法對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)中的前綴詞、成分詞、藥效詞和劑型詞進(jìn)行比較計(jì)算可以采用如下方法:
[0055]A、計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的前綴詞、劑型詞和其他后綴詞相似度,當(dāng)所述相似度達(dá)到或超過(guò)預(yù)定閾值,且判斷其中一個(gè)藥品標(biāo)注數(shù)據(jù)中的其他識(shí)別詞與另一個(gè)藥品名稱(chēng)中的成分詞或藥效詞或其他識(shí)別詞通過(guò)拼音模糊匹配合格,則判定所述兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)是模糊相同。
[0056]B、計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的成分詞和藥效詞相似度,當(dāng)所述相似度為完全相同時(shí),判定所述兩個(gè)藥瓶名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)為相同名稱(chēng)數(shù)據(jù)組。
[0057]C、藥品名稱(chēng)標(biāo)注數(shù)據(jù)比較若同時(shí)比較計(jì)算成分詞、藥效詞、劑型詞,則可以忽略前綴詞、其他后綴詞。
[0058]值得注意的是在B和C的比較過(guò)程中都可以利用A中的模糊比較方法。
[0059]本發(fā)明實(shí)施例中通過(guò)預(yù)置字典對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞,將分詞獲得的藥品名稱(chēng)標(biāo)注數(shù)據(jù)進(jìn)行比較計(jì)算,以獲取相同名稱(chēng)數(shù)據(jù)組,提高了相同藥品名稱(chēng)數(shù)據(jù)獲取的成功率,減少了計(jì)算量。
[0060]對(duì)于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。
[0061]如圖4所述為本發(fā)明提供的一種藥品名稱(chēng)數(shù)據(jù)匹配裝置,包括:
[0062]獲取模塊41,用于獲取藥品名稱(chēng)數(shù)據(jù);
[0063]分詞模塊42,用于根據(jù)預(yù)置字典對(duì)所述藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞生成藥品名稱(chēng)標(biāo)注數(shù)據(jù);所述預(yù)置字典至少包括:前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù);
[0064]比較模塊43,用于對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)通過(guò)比較算法生成相同藥品名稱(chēng)數(shù)據(jù)組。
[0065]進(jìn)一步,所述分詞模塊42用于:
[0066]根據(jù)預(yù)置字典中包含的前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù)對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞,所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)至少包括前綴詞、成分詞、藥效詞和劑型詞。
[0067]所述分詞模塊42將待比較的兩個(gè)藥品名稱(chēng)數(shù)據(jù)利用上述字典對(duì)其分詞,獲得藥品名稱(chēng)的藥品名稱(chēng)標(biāo)注數(shù)據(jù),所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)可以標(biāo)注“前綴詞”、“成分詞”、“藥效詞”、“其他識(shí)別詞”、“劑型詞”、“其他后綴詞”這樣的信息,然后比較模塊43將兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)分別在對(duì)應(yīng)標(biāo)注信息上進(jìn)行比較,只有在各標(biāo)注信息上都達(dá)成一致才能算作是名稱(chēng)相同,若兩個(gè)藥品名稱(chēng)的相似度為0-1的相似。在“前綴詞”對(duì)應(yīng)的兩組詞上,完全相同則一致,否則不一致。在“成分詞”對(duì)應(yīng)的兩組詞上,要利用別名表作為參照,如果完全相同或?qū)儆趧e名關(guān)系則成分詞一致,否則不一致。在“劑型詞”上判斷一致的方式與成分詞類(lèi)似,需要參考劑型詞與劑型信息的對(duì)應(yīng)關(guān)系?!八幮г~”、“其他識(shí)別詞”、“其他后綴詞”的內(nèi)容識(shí)別方式與“前綴詞”識(shí)別方式一致。
[0068]進(jìn)一步,所述比較模塊43還用于:
[0069]根據(jù)預(yù)置固定比較算法對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)中的前綴詞、成分詞、藥效詞和劑型詞計(jì)算相似度,當(dāng)所述相似度超過(guò)閾值的藥品名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)判定為相同名稱(chēng)數(shù)據(jù)組。
[0070]進(jìn)一步,所述比較模塊43還用于:
[0071]計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的前綴詞、劑型詞和其他后綴詞相似度,當(dāng)所述相似度達(dá)到或超過(guò)預(yù)定閾值,且判斷其中一個(gè)藥品標(biāo)注數(shù)據(jù)中的其他識(shí)別詞與另一個(gè)藥品名稱(chēng)中的成分詞或藥效詞或其他識(shí)別詞通過(guò)拼音模糊匹配合格,則判定所述兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)是模糊相同。
[0072]進(jìn)一步,所比較模塊43還用于:
[0073]計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的成分詞和藥效詞相似度,當(dāng)所述相似度為完全相同時(shí),判定所述兩個(gè)藥瓶名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)為相同名稱(chēng)數(shù)據(jù)組。
[0074]比較模塊43在進(jìn)行藥品名稱(chēng)標(biāo)注數(shù)據(jù)比較計(jì)算時(shí),若同時(shí)比較計(jì)算成分詞、藥效詞、劑型詞,則可以忽略前綴詞、其他后綴詞。
[0075]本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可。
[0076]以上對(duì)本申請(qǐng)所提供的一種藥品名稱(chēng)數(shù)據(jù)匹配方法和裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本申請(qǐng)的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本申請(qǐng)的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請(qǐng)的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本申請(qǐng)的限制。
【權(quán)利要求】
1.一種藥品名稱(chēng)數(shù)據(jù)匹配方法,其特征在于,包括: 獲取藥品名稱(chēng)數(shù)據(jù); 根據(jù)預(yù)置字典對(duì)所述藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞生成藥品名稱(chēng)標(biāo)注數(shù)據(jù);所述預(yù)置字典至少包括:前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù); 對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)通過(guò)比較算法生成相同藥品名稱(chēng)數(shù)據(jù)組。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)預(yù)置字典對(duì)所述藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞生成藥品名稱(chēng)標(biāo)注數(shù)據(jù)包括: 根據(jù)預(yù)置字典中包含的前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù)對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞,形成的藥品名稱(chēng)標(biāo)注數(shù)據(jù)包括前綴詞、成分詞、藥效詞和劑型詞。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)藥品名稱(chēng)標(biāo)注數(shù)據(jù)通過(guò)比較算法生成相同藥品名稱(chēng)數(shù)據(jù)組包括: 根據(jù)預(yù)置固定比較算法對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)中的前綴詞、成分詞、藥效詞和劑型詞計(jì)算相似度,當(dāng)所述相似度超過(guò)閾值的藥品名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)判定為相同名稱(chēng)數(shù)據(jù)組。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)預(yù)置固定比較算法對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)中的前綴詞、成分詞、藥效詞和劑型詞進(jìn)行比較計(jì)算包括: 計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的前綴詞、劑型詞和其他后綴詞相似度,當(dāng)所述相似度達(dá)到或超過(guò)預(yù)定閾值,且判斷其中一個(gè)藥品標(biāo)注數(shù)據(jù)中的其他識(shí)別詞與另一個(gè)藥品名稱(chēng)中的成分詞或藥效詞或其他識(shí)別詞通過(guò)拼音模糊匹配合格,則判定所述兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)是模糊相同。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)預(yù)置固定比較算法對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)中的前綴詞、成分詞、藥效詞和劑型詞進(jìn)行比較計(jì)算包括: 計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的成分詞和藥效詞相似度,當(dāng)所述相似度為完全相同時(shí),判定所述兩個(gè)藥瓶名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)為相同名稱(chēng)數(shù)據(jù)組。
6.一種藥品名稱(chēng)數(shù)據(jù)匹配裝置,其特征在于,包括: 獲取模塊,用于獲取藥品名稱(chēng)數(shù)據(jù); 分詞模塊42,用于根據(jù)預(yù)置字典對(duì)所述藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞生成藥品名稱(chēng)標(biāo)注數(shù)據(jù);所述預(yù)置字典至少包括:前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù); 比較模塊,用于對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)通過(guò)比較算法生成相同藥品名稱(chēng)數(shù)據(jù)組。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述分詞模塊42用于: 根據(jù)預(yù)置字典中包含的前綴詞字庫(kù)、成分詞字庫(kù)、藥效詞字庫(kù)和劑型詞字庫(kù)對(duì)藥品名稱(chēng)數(shù)據(jù)進(jìn)行分詞,所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)至少包括前綴詞、成分詞、藥效詞和劑型詞。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述比較模塊用于: 根據(jù)預(yù)置固定比較算法對(duì)所述藥品名稱(chēng)標(biāo)注數(shù)據(jù)中的前綴詞、成分詞、藥效詞和劑型詞計(jì)算相似度,當(dāng)所述相似度超過(guò)閾值的藥品名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)判定為相同名稱(chēng)數(shù)據(jù)組。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述比較模塊用于: 計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的前綴詞、劑型詞和其他后綴詞相似度,當(dāng)所述相似度達(dá)到或超過(guò)預(yù)定閾值,且判斷其中一個(gè)藥品標(biāo)注數(shù)據(jù)中的其他識(shí)別詞與另一個(gè)藥品名稱(chēng)中的成分詞或藥效詞或其他識(shí)別詞通過(guò)拼音模糊匹配合格,則判定所述兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)是模糊相同。
10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所比較模塊用于: 計(jì)算兩個(gè)藥品名稱(chēng)標(biāo)注數(shù)據(jù)的成分詞和藥效詞相似度,當(dāng)所述相似度為完全相同時(shí),判定所述兩個(gè)藥瓶名稱(chēng)標(biāo)注數(shù)據(jù)對(duì)應(yīng)的藥品名稱(chēng)數(shù)據(jù)為相同名稱(chēng)數(shù)據(jù)組。
【文檔編號(hào)】G06F17/27GK104268137SQ201310344291
【公開(kāi)日】2015年1月7日 申請(qǐng)日期:2013年7月31日 優(yōu)先權(quán)日:2013年7月31日
【發(fā)明者】邊旭, 賈西貝 申請(qǐng)人:深圳市華傲數(shù)據(jù)技術(shù)有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1