日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種人口數(shù)據(jù)的智能匹配方法

文檔序號(hào):9376407閱讀:802來(lái)源:國(guó)知局
一種人口數(shù)據(jù)的智能匹配方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息管理領(lǐng)域,具體而言,涉及一種人口數(shù)據(jù)的智能匹配方法。
【背景技術(shù)】
[0002] 大型企業(yè)和政府部門(mén)經(jīng)過(guò)多年的信息化建設(shè),擁有許多信息系統(tǒng),積累了大量業(yè) 務(wù)數(shù)據(jù),由于信息系統(tǒng)通常是分階段、分部門(mén)建設(shè)的,不同信息系統(tǒng)中的數(shù)據(jù)呈現(xiàn)出分布 性、自治性和異構(gòu)性等特點(diǎn)。如何對(duì)分布式、動(dòng)態(tài)化的數(shù)據(jù)進(jìn)行有效管理,以滿(mǎn)足更深層次 的數(shù)據(jù)應(yīng)用需求,是當(dāng)前信息化應(yīng)用領(lǐng)域研究的熱點(diǎn)之一,也是企業(yè)和政府部門(mén)在信息化 水平發(fā)展到一定階段后普遍面臨的問(wèn)題。
[0003] 隨著云計(jì)算模式的興起,這一問(wèn)題變得更加復(fù)雜,要滿(mǎn)足用戶(hù)對(duì)海量數(shù)據(jù)匯聚、校 核、匹配、管理等功能的要求,實(shí)現(xiàn)對(duì)已有數(shù)據(jù)資源的充分利用,需要有針對(duì)性的、更加智能 化的數(shù)據(jù)集成方法來(lái)有效整合分散于多個(gè)異構(gòu)數(shù)據(jù)源中的數(shù)據(jù),為跨部門(mén)的應(yīng)用提供完整 統(tǒng)一的數(shù)據(jù)視圖,為用戶(hù)提供無(wú)需考慮底層數(shù)據(jù)模型差異的,更方便、更快捷的數(shù)據(jù)服務(wù)。
[0004] 大數(shù)據(jù)環(huán)境下,信息規(guī)模急劇膨脹,信息類(lèi)型與來(lái)源日趨復(fù)雜,信息的管理與服務(wù) 模式也隨之發(fā)生著深刻的變化。當(dāng)信息分散存放于各個(gè)獨(dú)立的異構(gòu)系統(tǒng)中時(shí),描述同一實(shí) 體的屬性信息往往存在差異,主要原因有:1)數(shù)據(jù)資源之間缺乏統(tǒng)一的標(biāo)識(shí);2)輸入錯(cuò)誤 或稱(chēng)謂不一致;3)不同機(jī)構(gòu)管理和關(guān)注的實(shí)體屬性不同;4)數(shù)據(jù)采集時(shí)間不同,實(shí)體屬性 發(fā)生了變化等等。這些因素使得異構(gòu)數(shù)據(jù)源中同一實(shí)體的數(shù)據(jù)記錄難以準(zhǔn)確辨別。
[0005] 數(shù)據(jù)質(zhì)量是決定信息準(zhǔn)確性和有效性的關(guān)鍵因素,在數(shù)據(jù)整合過(guò)程中,如果無(wú)法 有效判斷不同數(shù)據(jù)源中的記錄是否代表著現(xiàn)實(shí)世界中的同一實(shí)體,會(huì)出現(xiàn)數(shù)據(jù)一致性、完 整性及準(zhǔn)確性等方面的問(wèn)題,從而影響信息服務(wù)質(zhì)量。在提高數(shù)據(jù)質(zhì)量的資源投入方面,性 價(jià)比最高的策略是數(shù)據(jù)入庫(kù)之前的錯(cuò)誤數(shù)據(jù)預(yù)防(Prevention),因此,對(duì)多數(shù)據(jù)源數(shù)據(jù)進(jìn) 行同一性匹配以減少重復(fù)數(shù)據(jù)與錯(cuò)誤數(shù)據(jù),是提升數(shù)據(jù)整合后數(shù)據(jù)質(zhì)量的重要措施。
[0006] 通過(guò)人工數(shù)據(jù)分析進(jìn)行數(shù)據(jù)匹配與融合,需要耗費(fèi)大量的人力和時(shí)間,在大數(shù)據(jù) 量情況下,單純靠人工分析無(wú)法實(shí)現(xiàn)大批量數(shù)據(jù)中的記錄匹配,亟需一種自動(dòng)化程度較高 的智能方法。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明提供一種人口數(shù)據(jù)的智能匹配方法,適用于大數(shù)據(jù)環(huán)境的,基于相似度閾 值分析的多源關(guān)系型數(shù)據(jù)智能匹配方法,用以實(shí)現(xiàn)自動(dòng)化程度較高的智能匹配。
[0008] 為達(dá)到上述目的,本發(fā)明提供了一種人口數(shù)據(jù)的智能匹配方法,包括以下步驟:
[0009] 根據(jù)待匹配對(duì)象的匹配類(lèi)別、匹配范圍、匹配分值、匹配方法、權(quán)重、匹配閾值配置 匹配規(guī)則;
[0010] 根據(jù)所配置的匹配規(guī)則,在目標(biāo)數(shù)據(jù)庫(kù)中執(zhí)行待匹配對(duì)象的匹配操作,具體包 括:
[0011] 假定待匹配對(duì)象的屬性數(shù)據(jù)集合為E1,目標(biāo)數(shù)據(jù)庫(kù)中匹配范圍內(nèi)的單個(gè)實(shí)體對(duì)象 的屬性數(shù)據(jù)集合為E2,計(jì)算El和E2的綜合相似度,根據(jù)綜合相似度與匹配閾值的關(guān)系確定 二者是否匹配。
[0012] 進(jìn)一步地,根據(jù)待匹配對(duì)象的匹配類(lèi)別、匹配范圍、匹配分值、匹配方法、權(quán)重、匹 配閾值配置匹配規(guī)則步驟包括:
[0013] 接收用戶(hù)輸入或選擇的匹配類(lèi)別;
[0014] 接收用戶(hù)輸入或選擇的一組配置項(xiàng),包括匹配范圍、匹配分值、匹配方法、權(quán)重;
[0015] 接收用戶(hù)輸入或選擇的完全匹配閾值、相似匹配閾值、未匹配閾值;
[0016] 根據(jù)用戶(hù)輸入或選擇的上述數(shù)據(jù)生成匹配規(guī)則。
[0017] 進(jìn)一步地,當(dāng)所述匹配類(lèi)型為定位匹配時(shí),輸入的匹配參數(shù)為公民身份號(hào)碼和/ 或姓名,通過(guò)查詢(xún)?nèi)丝跉v史信息庫(kù)中的公民身份號(hào)碼變更信息進(jìn)行匹配和/或通過(guò)查詢(xún)?nèi)?口歷史信息庫(kù)中的姓名變更信息或查詢(xún)生僻字代碼對(duì)照表進(jìn)行姓名生僻字匹配,返回結(jié)果 為人員ID、匹配值、匹配度代碼和匹配原因代碼。
[0018] 進(jìn)一步地,當(dāng)所述匹配類(lèi)型為基礎(chǔ)信息匹配時(shí),輸入的匹配參數(shù)為公民身份號(hào)碼、 姓名、性別、民族、出生日期、出生地中的至少一項(xiàng)數(shù)據(jù)項(xiàng),匹配時(shí)根據(jù)每一項(xiàng)匹配結(jié)果分值 落在的閾值范圍,判斷其匹配值,即為完全匹配、相似匹配或未匹配,返回結(jié)果項(xiàng)為匹配值、 匹配度代碼和匹配原因代碼。
[0019] 進(jìn)一步地,當(dāng)所述匹配方法為信息項(xiàng)目變更匹配時(shí),輸入的匹配參數(shù)為公民身份 號(hào)碼、姓名以及性別、民族、出生日期、出生地中的至少一項(xiàng)數(shù)據(jù)項(xiàng),匹配時(shí)即對(duì)公民身份號(hào) 碼、姓名以及性別、出生日期、民族、出生地中的至少一項(xiàng)是否做過(guò)變更進(jìn)行匹配,返回結(jié)果 為匹配值、匹配度代碼和匹配原因代碼。
[0020] 進(jìn)一步地,當(dāng)所述匹配方法為行政區(qū)劃代碼軌跡匹配時(shí),輸入的匹配參數(shù)為行政 區(qū)劃代碼,匹配時(shí)對(duì)出生地、戶(hù)籍地址含有區(qū)或縣級(jí)以上行政區(qū)劃代碼進(jìn)行匹配,返回結(jié)果 為匹配值、匹配度代碼和匹配原因代碼。
[0021] 進(jìn)一步地,當(dāng)所述匹配方法為生僻字匹配時(shí),輸入的匹配參數(shù)為姓名、出生地,匹 配時(shí)對(duì)姓名、出生地中含有生僻字進(jìn)行匹配,通過(guò)"Unicode編碼"查詢(xún)生僻字對(duì)照表信息, 如果是替代字,則定義為完全匹配,如果是諧音字,則根據(jù)匹配分值的定義規(guī)則向智能匹配 引擎返回相似匹配分值,如果未查詢(xún)到生僻字信息,則返回?zé)o匹配信息,返回結(jié)果為匹配 值、匹配度代碼和匹配原因代碼。
[0022] 進(jìn)一步地,為匹配類(lèi)別分別配置不同的接口,在執(zhí)行匹配操作時(shí),根據(jù)所要執(zhí)行的 匹配類(lèi)別進(jìn)行相應(yīng)接口的匹配調(diào)度,生成智能匹配結(jié)果。
【附圖說(shuō)明】
[0023] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0024] 圖1為本發(fā)明一個(gè)實(shí)施例的人口數(shù)據(jù)的智能匹配方法流程圖;
[0025] 圖2是本發(fā)明一個(gè)實(shí)施例的智能匹配引擎匹配規(guī)則配置流程圖;
[0026] 圖3為對(duì)應(yīng)于圖2實(shí)施例的新增智能匹配配置的界面圖;
[0027] 圖4為本發(fā)明一個(gè)實(shí)施例的智能匹配引擎定位匹配流程圖;
[0028] 圖5為本發(fā)明一個(gè)實(shí)施例的項(xiàng)目信息變更匹配流程圖;
[0029] 圖6為本發(fā)明一個(gè)實(shí)施例的行政區(qū)劃代碼軌跡匹配流程圖;
[0030] 圖7為本發(fā)明一個(gè)實(shí)施例的生僻字匹配流程圖。
【具體實(shí)施方式】
[0031] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有付出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0032] 圖1為本發(fā)明一個(gè)實(shí)施例的人口數(shù)據(jù)的智能匹配方法流程圖;如圖所示,該智能 匹配方法包括以下步驟:
[0033] Sl 10,根據(jù)待匹配對(duì)象的匹配類(lèi)別、匹配范圍、匹配分值、匹配方法、權(quán)重、匹配閾 值配置匹配規(guī)則;
[0034] S120,根據(jù)所配置的匹配規(guī)則,在目標(biāo)數(shù)據(jù)庫(kù)中執(zhí)行待匹配對(duì)象的匹配操作,具體 包括:
[0035] 假定待匹配對(duì)象的屬性數(shù)據(jù)集合為E1,目標(biāo)數(shù)據(jù)庫(kù)中匹配范圍內(nèi)的單個(gè)實(shí)體對(duì)象 的屬性數(shù)據(jù)集合為E2,計(jì)算El和E2的綜合相似度,根據(jù)綜合相似度與匹配閾值的關(guān)系確定 二者是否匹配。
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1