日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種基于關(guān)聯(lián)規(guī)則的分布式多標(biāo)簽圖像識(shí)別方法

文檔序號(hào):10471512閱讀:420來源:國知局
一種基于關(guān)聯(lián)規(guī)則的分布式多標(biāo)簽圖像識(shí)別方法
【專利摘要】本發(fā)明公開了一種基于關(guān)聯(lián)分類規(guī)則的分布式多標(biāo)簽圖像識(shí)別方法,該方法包括分布圖像樣本的預(yù)處理、圖像分割、特征提取、特征值離散化、全局頻繁項(xiàng)目集L的挖掘、多標(biāo)簽關(guān)聯(lián)分類規(guī)則MLACR的構(gòu)造和圖像識(shí)別;采用了一種基于二進(jìn)制形式的全局候選項(xiàng)目集生成、修剪以及支持?jǐn)?shù)計(jì)算方法,降低了算法的實(shí)現(xiàn)難度以及通信量。該方法經(jīng)過兩次修剪操作,明顯縮小了全局候選項(xiàng)目集的規(guī)模,進(jìn)一步提高了算法的執(zhí)行效率。方法使用了約簡方法,確保MLACR中不會(huì)出現(xiàn)多余規(guī)則。該方法可以一次性地識(shí)別出訓(xùn)練樣本分布式情況下圖像所包含的多個(gè)標(biāo)簽,可以快速生成分布式環(huán)境下的全局候選頻繁項(xiàng)目集及其支持?jǐn)?shù)的計(jì)算,實(shí)現(xiàn)準(zhǔn)確高效的多標(biāo)簽圖像識(shí)別功能。
【專利說明】
-種基于關(guān)聯(lián)規(guī)則的分布式多標(biāo)簽圖像識(shí)別方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于多標(biāo)簽圖像的計(jì)算機(jī)分析技術(shù)的應(yīng)用領(lǐng)域,具體設(shè)及一種具有分布式 多標(biāo)簽圖像的識(shí)別方法。
【背景技術(shù)】
[0002] 多標(biāo)簽圖像識(shí)別是數(shù)據(jù)挖掘技術(shù)中的一個(gè)重要研究分支,它旨在通過訓(xùn)練圖像樣 本數(shù)據(jù)集來構(gòu)造一個(gè)分類函數(shù)或分類器,并利用該分類函數(shù)或分類器來識(shí)別待測(cè)圖像的標(biāo) 簽集。目前,可用于圖像識(shí)別的多標(biāo)簽分類方法有亂-Κ順、改進(jìn)的C4.5、Bp-MLL、PT系列、 ?口1'、??1'-11、114(:、1?4邸1^、1??(:、化1?、^50^、]\111^、]\0^-〔1841?2等。肥-1(順是2}1日叫]\1丄.等人提 出的一種基于I^N的多標(biāo)簽分類方法,該方法通過統(tǒng)計(jì)方法得出每個(gè)標(biāo)簽的先驗(yàn)概率,當(dāng)輸 入一個(gè)待測(cè)圖像數(shù)據(jù)X時(shí),對(duì)標(biāo)簽集S中的每個(gè)標(biāo)簽S分別計(jì)算X具有標(biāo)簽S和不具有標(biāo)簽S的 概率,進(jìn)而預(yù)測(cè)X是否具有標(biāo)簽S。算法化-M化通過定義針對(duì)多標(biāo)簽圖像數(shù)據(jù)的全局優(yōu)化函 數(shù),使得人工神經(jīng)元網(wǎng)絡(luò)能夠處理多標(biāo)簽數(shù)據(jù)。PT系列算法試圖利用已有的基于單標(biāo)簽的 分類方法來解決多標(biāo)簽分類問題,即在訓(xùn)練之前一次性地將訓(xùn)練圖像樣本數(shù)據(jù)集中所有包 含多個(gè)標(biāo)簽的訓(xùn)練數(shù)據(jù)樣本轉(zhuǎn)換成單標(biāo)簽數(shù)據(jù),經(jīng)過相應(yīng)處理后,算法所面對(duì)的訓(xùn)練數(shù)據(jù) 樣本集均為單標(biāo)簽樣本集,從而將多標(biāo)簽分類問題轉(zhuǎn)化為單標(biāo)簽分類問題。針對(duì)PT方法中 新標(biāo)簽數(shù)量的不可控性,算法PPT、ΡΡΤ-η、RAK化提出了一系列處理方法,算法PPT和ΡΡΤ-η通 過闊值的設(shè)置來減少新標(biāo)簽的數(shù)量,算法RAK化則是通過隨機(jī)選擇的方式來減少其數(shù)量的。 算法RPCXLR則通過對(duì)比標(biāo)簽集S中任意兩個(gè)標(biāo)簽之間的關(guān)系,建立k化-1)/2個(gè)分類器,每 個(gè)分類器在兩個(gè)標(biāo)簽之間投票,組合運(yùn)些投票結(jié)果作為最終的多標(biāo)簽分類結(jié)果nMkCMBAR2 是一種基于關(guān)聯(lián)規(guī)則的多標(biāo)簽分類方法。
[0003] 在許多實(shí)際應(yīng)用中,數(shù)據(jù)本身是分布的,它們之間除了通過網(wǎng)絡(luò)傳遞信息外,其它 資源全部獨(dú)立。為解決此類問題,一個(gè)可行的方案是將運(yùn)些數(shù)據(jù)集集中到某一臺(tái)機(jī)器上,再 利用現(xiàn)有算法來構(gòu)造多標(biāo)簽分類器,或利用MapReduce編程模型來構(gòu)造分布環(huán)境下的多標(biāo) 簽分類器。一般情況下,此類思想至少存在兩個(gè)方面的問題,一是需要一臺(tái)性能較(很)高的 計(jì)算機(jī)來存儲(chǔ)并處理大容量的數(shù)據(jù),二是在很多情況下,出于對(duì)數(shù)據(jù)安全性和隱私性的考 慮,數(shù)據(jù)是不可能集中起來的。對(duì)此,本發(fā)明提出了一種基于關(guān)聯(lián)規(guī)則的分布式多標(biāo)簽圖像 識(shí)別方法,該方法通過發(fā)現(xiàn)分布環(huán)境下訓(xùn)練圖像樣本數(shù)據(jù)集中的關(guān)聯(lián)規(guī)則來構(gòu)造多標(biāo)簽分 類器,由此實(shí)現(xiàn)圖像的自動(dòng)識(shí)別。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明的目的是提供一種一次性對(duì)包含多個(gè)標(biāo)簽的圖像進(jìn)行識(shí)別的方法,該方法 可W快速生成分布式環(huán)境下的全局候選頻繁項(xiàng)目集及其支持?jǐn)?shù)的計(jì)算,實(shí)現(xiàn)準(zhǔn)確高效的多 標(biāo)簽圖像識(shí)別功能。
[0005] 本發(fā)明的技術(shù)方案是:一種基于關(guān)聯(lián)規(guī)則的分布式多標(biāo)簽圖像識(shí)別方法,包括全 局候選頻繁項(xiàng)目集的生成、支持?jǐn)?shù)的計(jì)算W及圖像識(shí)別步驟,其特征在于:所述全局候選頻 繁項(xiàng)目集的生成、支持?jǐn)?shù)的計(jì)算和圖像識(shí)別步驟包括:
[0006] 步驟1分布式圖像樣本數(shù)據(jù)集的準(zhǔn)備和預(yù)處理,包括各站點(diǎn)訓(xùn)練圖像格式轉(zhuǎn)換、尺 度歸一化、去噪、增強(qiáng);
[0007] 步驟2各站點(diǎn)采用基于密度聚類的圖像分割方法分別識(shí)別出每幅訓(xùn)練圖像的待識(shí) 別區(qū)域;
[0008] 步驟3各站點(diǎn)分別提取每幅訓(xùn)練圖像中待識(shí)別區(qū)域的特征,構(gòu)造各站點(diǎn)的訓(xùn)練圖 像樣本數(shù)據(jù)庫DBi,所述圖像樣本數(shù)據(jù)集DBi的模式為關(guān)系模式R(Ai,.,Ap,Bi,.,Bq),其中P和 q分別為非柄簽屬性和柄簽屬性的個(gè)數(shù),Ai, . ,Αρ為非柄;簽屬性的屬性名,Bi, . ,Bq為柄;簽屬 性的屬性名,i = 1,2,...,η??偟挠?xùn)練樣本集DB = DBi U DB2 U ...... U DBn,DBi Π DBj =巫,i 聲 j ;
[0009] 步驟4特征值離散化,各站點(diǎn)分別對(duì)連續(xù)屬性進(jìn)行離散化;
[0010] 步驟5全局頻繁項(xiàng)目集L的挖掘;
[0011] 步驟6多標(biāo)簽關(guān)聯(lián)分類規(guī)則MLACR的構(gòu)造,所述多標(biāo)簽關(guān)聯(lián)分類規(guī)則MLACR的構(gòu)造 分為多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)貝1JMLFCAR的構(gòu)造和多標(biāo)簽關(guān)聯(lián)分類規(guī)貝1JMLACR的生成,其步驟 包括:
[0012] 步驟6.1構(gòu)造多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則的前件P和后件Q,其中:所述前件為全局頻 繁項(xiàng)目集L中所包含的非標(biāo)簽屬性集,所述后件為全局頻繁項(xiàng)目集L中所包含的標(biāo)簽屬性 集;
[0013] 步驟6.2分別計(jì)算多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR中各分類規(guī)則的置信度,其中 規(guī)則R的置信度計(jì)算公式為:Count(P U Q)/Count(P);
[0014] 步驟6.3刪除多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR中置信度小于minconf的分類規(guī)則, 構(gòu)造最終的多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR,其中minconf為最小置信度闊值;
[001引步驟6.4對(duì)多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR進(jìn)行約簡,得到多標(biāo)簽關(guān)聯(lián)分類規(guī)則 MLACR;
[0016] 步驟7圖像識(shí)別。
[0017] 所述步驟5全局頻繁項(xiàng)目集L的挖掘的具體步驟包括:
[001引步驟5.1初始化,其包括:
[0019] 步驟5.1.1選擇η個(gè)站點(diǎn)Si、S2、......、Sn中一個(gè)站點(diǎn)或其它獨(dú)立主機(jī)作為主計(jì)算機(jī) (記為站點(diǎn)S);
[0020]步驟5.1.2各站點(diǎn)分別將其上的訓(xùn)練圖像樣本數(shù)據(jù)DBi轉(zhuǎn)換成二進(jìn)制形式的數(shù)據(jù) 庫,為方便起見運(yùn)里仍記為DBi;
[0021 ] 步驟5.1.3設(shè)置DB中的非標(biāo)簽屬性集NLA和標(biāo)簽屬性集LA,NLA= {Ai,.,Ap},LA = (Bl,.,Bq};
[0022] 步驟5.1.4各站點(diǎn)分別統(tǒng)計(jì)非標(biāo)簽屬性集NLA和標(biāo)簽屬性集LA中各屬性的支持?jǐn)?shù), 并將其支持?jǐn)?shù)發(fā)給主機(jī)S;
[0023] 步驟5.1.5主機(jī)計(jì)算標(biāo)簽屬性中的全局頻繁1-項(xiàng)目集化1= k e LA I S叩(C) > minsup};
[0024] 步驟5.1.6主機(jī)計(jì)算非標(biāo)簽屬性中的全局頻繁1-項(xiàng)目集化b = keNLAl sup(c)> minsup};
[002引步驟5.1.7主機(jī)計(jì)算DB中的全局頻繁1-項(xiàng)目集化1 U化^;
[0026] 其中:minsup為給定的最小支持度闊值;c為給定項(xiàng)目集;Count(c)為支持?jǐn)?shù),是項(xiàng) 目集C在DB中出現(xiàn)的次數(shù);Sup (C)為支持度,Sup(C) = Count (C)/ IDB I,IDB I表示總訓(xùn)練圖像 樣本數(shù)據(jù)集DB中樣本的個(gè)數(shù);
[0027] 步驟5.2全局候選頻繁項(xiàng)目集的生成(由主機(jī)S來完成),其包括:
[002引步驟5.2.1根據(jù)全局頻繁k-項(xiàng)目集Lk生成全局候選頻繁化+1)-項(xiàng)目集Ck+i,其中k 為全局頻繁項(xiàng)目集的長度;
[0029] 步驟5.2.2各站點(diǎn)計(jì)算全局候選頻繁項(xiàng)目集Ck+i中各項(xiàng)目集的支持?jǐn)?shù);
[0030] 步驟5.2.3主機(jī)統(tǒng)計(jì)全局候選頻繁項(xiàng)目集Ck+沖各項(xiàng)目集的支持?jǐn)?shù),并根據(jù)最小支 持度闊值minsup生成全局頻繁化+1)-項(xiàng)目集Lk+i;
[0031 ]步驟5.2.4重復(fù)步驟5.2.1、步驟5.2.2、步驟5.2.3,若生成全局候選頻繁項(xiàng)目集為 空,則進(jìn)入步驟5.3;
[0032] 步驟5.3生成全局頻繁項(xiàng)目聾
[0033] 所述步驟7主機(jī)進(jìn)行圖像識(shí)別的具體步驟包括:
[0034] 步驟7.1待識(shí)別圖的準(zhǔn)備和預(yù)處理,包括訓(xùn)練圖像格式轉(zhuǎn)換、尺度歸一化、去噪和 增強(qiáng);
[0035] 步驟7.2主機(jī)采用基于密度聚類的圖像分割方法識(shí)別出所述待識(shí)別圖像的待識(shí)別 區(qū)域;
[0036] 步驟7.3提取出所述待識(shí)別圖像中待識(shí)別區(qū)域的非標(biāo)簽屬性特征;
[0037] 步驟7.4非標(biāo)簽屬性特征值離散化;
[003引步驟7.5根據(jù)多標(biāo)簽關(guān)聯(lián)分類規(guī)貝1JMLACR識(shí)別所述待識(shí)別圖像的標(biāo)簽屬性。
[0039] 所述步驟5.2.1根據(jù)全局頻繁k-項(xiàng)目集Lk生成全局候選頻繁化+1)-項(xiàng)目集Ck+i的 具體步驟包括:
[0040] 步驟5.2.1.1選擇全局頻繁k-項(xiàng)目集Lk中的任意兩個(gè)不同項(xiàng)目集C1和C2,如果所述 C1和C2的或運(yùn)算結(jié)果中包含且只包含k+1個(gè)1,則Ck+1+二U C2};
[0041 ]步驟5.2.1.2重復(fù)步驟5.2.1.1,直到完成所有的項(xiàng)目集對(duì)比較,得到全局候選頻 繁化+1)-項(xiàng)目集Ck+i;
[0042]步驟5.2.1.3對(duì)Ck+i中任意項(xiàng)目集C,如果所述項(xiàng)目集C存在長度為k的子集C3,且 〇3掉。,刪除所述項(xiàng)目集(3;
[00創(chuàng)步驟5.1.2.4刪除Ck+沖只包含標(biāo)簽屬性或非標(biāo)簽屬性的項(xiàng)目集。
[0044] 所述步驟6.4對(duì)多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR進(jìn)行約簡,得到多標(biāo)簽關(guān)聯(lián)分類 規(guī)則MLACR的具體步驟包括:
[0045] 步驟6.4.1選擇多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR中前件長度最短的規(guī)則R1;
[0046] 步驟6.4.2計(jì)算MLACR=MLACRU{Rl};
[0047] MLFCAR=MLFCAR-{Ri};
[004引步驟6.4.3對(duì)于每個(gè)多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR中的規(guī)則R,如果規(guī)則R1覆蓋 規(guī)則R,則執(zhí)行
[0049] MLFCAR=MLFCAR-{R};
[0050] MLACR=MLACRU {R};
[0051 ]步驟6.4.4如果多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR不為空,重復(fù)執(zhí)行步驟6.4.1至步 驟6.4.4。
[0052] 所述步驟6.4.3中的規(guī)則R1覆蓋規(guī)則R是指對(duì)于多標(biāo)簽關(guān)聯(lián)分類規(guī)則Ri: Pi =>Qi和 R: Ρ2^()2,滿足PicP;,Q| 化,其中P1和Q1分別為規(guī)則R1的前件和后件,P2和Q2分別為規(guī) 貝化的前件和后件。
[0053] 所述步驟3的非標(biāo)簽屬性包括均值、方差、傾斜度、峰態(tài)、能量、賭和聚類特征。
[0054] 本發(fā)明的主要有益效果是可W-次性地識(shí)別出訓(xùn)練樣本分布式情況下圖像所包 含的多個(gè)標(biāo)簽,并就識(shí)別過程中全局候選頻繁項(xiàng)目集的構(gòu)造 W及規(guī)則的后處理等方面給出 了相應(yīng)的優(yōu)化解決方案,其主要體現(xiàn)在:
[0055] (1)全局候選項(xiàng)目集的生成方面
[0056] 對(duì)于關(guān)聯(lián)規(guī)則挖掘中全局候選項(xiàng)目集的生成問題,本發(fā)明提出了一種基于二進(jìn)制 形式的全局候選項(xiàng)目集生成、修剪W及支持?jǐn)?shù)計(jì)算等方法,方法用二進(jìn)制形式來描述訓(xùn)練 樣本W(wǎng)及全局候選項(xiàng)目集,簡化了全局候選項(xiàng)目集的生成、傳輸及其支持?jǐn)?shù)的計(jì)算過程,降 低了算法的實(shí)現(xiàn)難度。另外,經(jīng)過兩次修剪操作,明顯縮小了全局候選項(xiàng)目集的規(guī)模,進(jìn)一 步提高了算法的執(zhí)行效率。
[0057] (2)多標(biāo)簽關(guān)聯(lián)分類規(guī)則的后處理方面
[005引對(duì)于多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR而言,它可能存在兩個(gè)方面的問題,一是 MLFCAR中包含相互覆蓋的規(guī)則;二是MLFCAR中包含相互矛盾的規(guī)貝1J。對(duì)此,本發(fā)明給出了一 種多標(biāo)簽關(guān)聯(lián)分類規(guī)則的約簡方法,該方法可W確保MLACR中不會(huì)出現(xiàn)多余規(guī)則,極大地方 便了規(guī)則的使用,進(jìn)一步提高了本發(fā)明的有效性和可操作性。
【附圖說明】
[0059] 圖1是本發(fā)明實(shí)施例的結(jié)構(gòu)框圖
[0060] 圖2是本發(fā)明實(shí)施例中全局頻繁項(xiàng)目集挖掘流程圖
[0061] 圖3是本發(fā)明實(shí)施例中多標(biāo)簽關(guān)聯(lián)分類規(guī)則庫構(gòu)造流程
【具體實(shí)施方式】
[0062] 設(shè)分布環(huán)境下的η個(gè)站點(diǎn)分別是Si、S2、……、S。,它們之間除了通過網(wǎng)絡(luò)傳遞信息 夕h其它資源(如硬盤、內(nèi)存等)全部獨(dú)立,站點(diǎn)Si(i = l,2,-.,11)上的訓(xùn)練圖像樣本數(shù)據(jù)集 為DBi,總的訓(xùn)練樣本集DB = DBi U DB2 U ...... U DBn,且DBi Π DBj =巫,i 聲 j。1?(Ai,.,Ap,Bi,., Bq)為訓(xùn)練圖像樣本數(shù)據(jù)集DBi的關(guān)系模式,其中p和q分別為非標(biāo)簽屬性和標(biāo)簽屬性的個(gè)數(shù), Ai,.,Ap為非標(biāo)簽屬性的屬性名,Bi,.,Bq為標(biāo)簽屬性的屬性名。如圖1所示,其主要包括W下 幾個(gè)方面的內(nèi)容:
[006;3] (1)預(yù)處理
[0064]各站點(diǎn)分別進(jìn)行訓(xùn)練圖像樣本數(shù)據(jù)集的準(zhǔn)備、格式轉(zhuǎn)換、尺度歸一化、去噪、增強(qiáng)。 [00化](2)圖像分割
[0066] 各站點(diǎn)均采用基于密度聚類的圖像分割方法分別識(shí)別出每幅訓(xùn)練圖像的待識(shí)別 區(qū)域。
[0067] (3)特征提取
[0068] 各站點(diǎn)分別提取每幅訓(xùn)練圖像中待識(shí)別區(qū)域的特征,構(gòu)造各站點(diǎn)的訓(xùn)練圖像樣本 數(shù)據(jù)庫 DBi,i = l,2r..,n。
[0069] (4)特征值離散化
[0070] 各站點(diǎn)分別對(duì)連續(xù)屬性進(jìn)行離散化,非標(biāo)簽屬性通過如下方法統(tǒng)一起來:
[0071] ①數(shù)值屬性值按區(qū)間離散化,映射到連續(xù)正整數(shù)集合{〇,1,2,···}上;具體參見實(shí) 例部分。
[0072] ②離散屬性值按字典序排序,映射到連續(xù)正整數(shù)集合{0,1,2,…}上。
[0073] (5)全局頻繁項(xiàng)目集L的挖掘
[0074] 設(shè)最小支持度闊值為minsup,給定項(xiàng)目集C,設(shè)其支持?jǐn)?shù)記為Count(c),相應(yīng)的支 持度記為Sup(c),Sup(c) = Count(c)/ I DB I,|DB I表示訓(xùn)練圖像樣本數(shù)據(jù)集DB中樣本的個(gè) 數(shù)。如圖2所示,全局頻繁項(xiàng)目集L的挖掘分為初始化、全局候選頻繁項(xiàng)目集的生成、全局候 選頻繁項(xiàng)目集支持?jǐn)?shù)的計(jì)算。
[00巧]①初始化
[0076] 初始化包括下列步驟:
[0077] a選擇η個(gè)站點(diǎn)Si、S2、......、Sn中一個(gè)站點(diǎn)或其它獨(dú)立主機(jī)作為主計(jì)算機(jī)(記為站點(diǎn) S),該機(jī)用來統(tǒng)計(jì)全局頻繁項(xiàng)目集的支持?jǐn)?shù)(度);
[0078] b各站點(diǎn)分別將其上的訓(xùn)練圖像樣本數(shù)據(jù)庫DBi轉(zhuǎn)換成二進(jìn)制形式的數(shù)據(jù)庫,記為 DBi,女Πp = 5,q = 2時(shí),記錄Rl(Al = l,A2 = 0,A3 = l,Al4=l,A5 = l,Bl = l,B2 = l)轉(zhuǎn)換后的結(jié)果 為1011111;
[0079] C設(shè)置DB中的非標(biāo)簽屬性集NLA和標(biāo)簽屬性集LA,NLA={Ai,.,Ap},LA={Bi,.,Bq};
[0080] d各站點(diǎn)分別統(tǒng)計(jì)非標(biāo)簽屬性集NLA和標(biāo)簽屬性集LA中各屬性的支持?jǐn)?shù),并將其支 持?jǐn)?shù)發(fā)給主機(jī)S;
[0081] e山=keLAl sup(c)>minsup} ;//化功標(biāo)簽屬性中的全局頻繁1-項(xiàng)目集,由主 機(jī)S計(jì)算并保存在主機(jī)S上
[0082] f keNLAI S叫(C)>minsup} 山為非標(biāo)簽屬性中的全局頻繁1-項(xiàng)目 集,由主機(jī)S計(jì)算并保存在主機(jī)S上
[00削 g山U化山//1功08中的全局頻繁1-項(xiàng)目集,保存在主機(jī)S上
[0084] ②全局候選頻繁項(xiàng)目集的生成(由主機(jī)S來完成)
[0085] 設(shè)Lk是長度為k的全局頻繁項(xiàng)目集,其中的全局頻繁項(xiàng)目集均為二進(jìn)制形式,由Lk 生成全局候選頻繁化+1)-項(xiàng)目集Ck+I的方法包括下列步驟:
[0086] a Ck+i=〇 ;//Ck+功所有全局候選頻繁化+1)-項(xiàng)目集所對(duì)應(yīng)的二進(jìn)制數(shù)的集合, 初始為空集
[0087]
的項(xiàng)目集,因?yàn)檫@些候選項(xiàng)目集不可能構(gòu)成多標(biāo)簽關(guān)聯(lián)分類規(guī)則
[0089] ③全局候選頻繁項(xiàng)目集Ck+i中各項(xiàng)目集支持?jǐn)?shù)的計(jì)算
[0090] 主機(jī)S將Ck+1中的全局候選項(xiàng)目集直接傳送至各站點(diǎn),各站點(diǎn)Si(i = l,2,……,n) 計(jì)算Ck+i中各項(xiàng)目集支持?jǐn)?shù)的方法包括下列步驟: a Γογ each iransaciion 1色 DBi do b目gin b for each b^Ck+l do e ii*t or b= lihen
[0091] d Coum(b)++;: e end f各站點(diǎn)將各全局候選項(xiàng)目集的支持?jǐn)?shù)傳送給主機(jī)s;
[0092] ④全局頻繁項(xiàng)目集L的生成
[0093] 全局頻繁項(xiàng)目集L生成包括W下步驟:
[0094] a主機(jī)S接受來自各站點(diǎn)的支持?jǐn)?shù);
[0095] b計(jì)算Ck+沖各全局候選項(xiàng)目集的支持?jǐn)?shù);
[0096] C Lk+i=kECk+i|sup(c)>minsup}
[0097] d L = 1^iUL2U...;
[009引(6)多標(biāo)簽關(guān)聯(lián)分類規(guī)貝IJMLACR的構(gòu)造(由主機(jī)S來完成)
[0099] 設(shè)最小置信度闊值為minconf,多標(biāo)簽關(guān)聯(lián)分類規(guī)則MLACR的構(gòu)造分為多標(biāo)簽頻繁 關(guān)聯(lián)分類規(guī)則MLFCAR的構(gòu)造和多標(biāo)簽關(guān)聯(lián)分類規(guī)則MLACR的生成。
[0100] ①多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR的構(gòu)造
[0101] MLFCAR的構(gòu)造包括下列步驟: a MLFCA民=史;"初始化 b Ibr each c e L do e: MLFCAR= MLFCARu { IXiU//構(gòu)造《標(biāo)簽頻繁關(guān)聯(lián)分類
[0102] 規(guī)則的前件和后件 d r〇r each 艮e MLFCAR e Conf(R) = Count(PuQ)/Count(P);Z/P、Q分別為規(guī)貝化的的件和后件 f ir(Conl'(R)< minconO 山cri
[0103] 徑 MLFCAR== MLFCAR-; R!;
[0104] ②多標(biāo)簽關(guān)聯(lián)分類規(guī)則MLACR的生成 [01化]MLACR的生成包括下列步驟: a MLACR=0;^初始化 b while (MLFCA民卓 Φ ) c MLAC民=MLAC民u很i};// Ri為MLFCAR中規(guī)則前件長度最短的規(guī)則 d MLFCAR = MLFCAR - ? RI!;
[0106] e for each Re MLFCAR f 巧規(guī)則Ri覆蓋規(guī)則R)也en//覆蓋的定文參見定文1,具體含義參見實(shí)例部分 g MLFCAR= MLFCAR-|R1; 虹 MLACR = MLACRu!Rh
[0107] 定義1對(duì)于給定的兩個(gè)多標(biāo)簽關(guān)聯(lián)分類規(guī)則熱和R2:B二獲,如果P,Qi、 Q:i.3 〇2,·貝!1幸爾夫巧貝!11?1^:^夫見貝!11?2。
[0108] (7)圖像的識(shí)別(主機(jī)完成)
[0109] 對(duì)于一幅未知標(biāo)簽集的圖像t,其識(shí)別過程包括W下步驟:
[0110] ①預(yù)處理
[0111] 對(duì)圖像t進(jìn)行格式轉(zhuǎn)換、尺度歸一化、去噪、增強(qiáng)等處理。
[0112] ②圖像分割
[0113] 采用基于密度聚類的圖像分割方法識(shí)別出圖像t的待識(shí)別區(qū)域。
[0114] ③特征提取
[0115] 提取出圖像t中待識(shí)別區(qū)域的特征。
[0116] ④特征值離散化
[0117] 特征值離散化的具體方法參見步驟(4)。
[011引⑤圖像識(shí)別
[0119] 設(shè)圖像t經(jīng)上述4步處理后得到的離散特征值為Vt,Vt=(t.Ai = ti,……,t.Ai = ti,……,*.4。= *。)。圖像*的識(shí)別過程包括^下步驟: a 抜r each R 居 MLAC民
[0120] b if (Vt包含民的前件)化畑 C 將民的后件賦給圖像t,圖像t的標(biāo)簽集即為及的后件:; 過 break;//結(jié)束圖像的識(shí)別
[0121] e if (MLAC民中不存在規(guī)則前件被Vt包含的規(guī)則)化cti f 將MLAC民中與Vt匹配屬性數(shù)最多的那個(gè)規(guī)則的后件賦給圖像t,闖像I 的標(biāo)簽集即為該規(guī)則的宿件。
[0122] 下面W分布式醫(yī)學(xué)圖像為實(shí)施例,詳細(xì)地說明本發(fā)明的執(zhí)行過程。本實(shí)例共選擇 了 100幅醫(yī)學(xué)圖像,它們分別分布在Ξ臺(tái)獨(dú)立的站點(diǎn)上,站點(diǎn)1、2、3上各存放了 35、35、30幅 樣本醫(yī)學(xué)圖像,另有一臺(tái)獨(dú)立的主機(jī)8,9 = 4,81、82、83、84分別為疾病1、疾病2、疾病3、疾病 4,具體執(zhí)行步驟如下:
[0123] (1)各站點(diǎn)分別對(duì)運(yùn)100幅醫(yī)學(xué)圖像進(jìn)行格式轉(zhuǎn)換、尺度歸一化、去噪、增強(qiáng)處理。
[0124] (2)各站點(diǎn)分別分割并提取每幅醫(yī)學(xué)圖像中待識(shí)別區(qū)域的相關(guān)特征并進(jìn)行歸一化 處理,結(jié)果如表1所示。本發(fā)明實(shí)例所提取的特征包括均值、方差、傾斜度、峰態(tài)、能量、賭和 聚類特征,即9 = 7、41、42、43、44、45、46、47分別為均值、方差、傾斜度、峰態(tài)、能量、賭、聚類特 征。
[0125] (3)數(shù)值屬性離散化。各站點(diǎn)分別對(duì)表1中的各屬性進(jìn)行離散化處理,其方法可采 用等寬劃分、等深劃分或基于距離的劃分等方法。本實(shí)例采用等寬劃分,即將0到1區(qū)間劃分 成 20 份,分別為(0.00,0.05] ,(0.05,0.10],···,(0.95,1.00]。如:第四條記錄{0.3974, 0.4812,0.5222,0.4316,0.1525,0.7633,0.6608}的離散化值為:{(0.35,0.40] ,(0.45, 0.50],(0.50,0.55],(0.40,0.45],(0.15,0.20],(0.75,0.80],(0.65,0.70]}〇
[0126] 表1醫(yī)學(xué)圖像特征表 Γ01271
[0129] (4)離散區(qū)間整數(shù)化。各站點(diǎn)分別將數(shù)值屬性的離散區(qū)間映射成連續(xù)的整數(shù)標(biāo)識(shí), 分別將(0.00,0.05] ,(0.05,0.10],…,(0.95,1.00]映射成1,2,3,…,20,則第四條記錄離 散區(qū)間整數(shù)化后為{08,10,11,09,04,16,14}。經(jīng)處理后,表1轉(zhuǎn)換成如表2的形式。
[0130] (5)屬性的二進(jìn)制化。各站點(diǎn)分別將離散化后的屬性值進(jìn)行二進(jìn)制轉(zhuǎn)換,表2轉(zhuǎn)換 成如表3的形式,運(yùn)些二進(jìn)制數(shù)將駐留在各站點(diǎn),其目的是為了方便全局候選項(xiàng)目集支持?jǐn)?shù) 的計(jì)算。
[0131] 表2離散區(qū)間整數(shù)化后的結(jié)果表
[0132]
[0134]表3屬性二進(jìn)制化后的結(jié)果表
[0135]
[0137] (5)全局頻繁項(xiàng)目集L的挖掘
[0138] 設(shè)最小支持度闊值minsup為0.2,生成至少包含{均值、方差、傾斜度、峰態(tài)、能量、 賭和聚類特征}之一和{疾病1,疾病2,疾病3,疾病4}之一的全局頻繁項(xiàng)目集L,具體如下:
[0139] ①各站點(diǎn)掃描其上經(jīng)屬性二進(jìn)制化后的結(jié)果表,得到各屬性值的支持?jǐn)?shù),并將其 傳送給主機(jī)S,主機(jī)S統(tǒng)計(jì)各屬性值的支持?jǐn)?shù),根據(jù)最小支持度闊值minsup生成全局頻繁1- 項(xiàng)目集Li,l^i= {{均值= 01000},愧值= 01011 },{均值= 01010},{方差= 01011 },{方差二 01010},{方差= 01001 },{傾斜度= 01011 },{傾斜度=01100},{峰態(tài)= 01001 },{峰態(tài)= 01000},{能量= 00011},{能量= 00100},{聚類特征= 01100},{聚類特征= 01110},{疾病 1},{疾病2},{疾病3},{疾病4} },如掃描傳輸后項(xiàng)目集{均值= 01000}的支持?jǐn)?shù)為25,即 Count({均值= 01000})=25,Sup({均值= 01000}) = Count({均值= 00111 })/|Τ| =25/100 = 0.25,由于Sup( {均值= 01000} )〉minsup,因而項(xiàng)目集{均值= 01000}是一個(gè)全局頻繁項(xiàng) 目集,其余項(xiàng)目集類推;
[0140] ②主機(jī)討良據(jù)b生成同時(shí)包含標(biāo)簽屬性和非標(biāo)簽屬性的全局候選頻繁2-項(xiàng)目集C2, C2={{均值= 01000,疾病1},{均值= 01000,疾病2},{均值= 01000,疾病3},{均值= 01000,疾病4},{均值= 01011,疾病1},{均值= 01011,疾病2},{均值= 01011,疾病3},{:均 值= 01011,疾病4},……,{:傾斜度= 01100,疾病1},{傾斜度= 01100,疾病2},{傾斜度= 01100,疾病3},{傾斜度= 01100,疾病4},……}。
[0141] ③主機(jī)S將全局候選頻繁2-項(xiàng)目集C2傳送給站點(diǎn)1、站點(diǎn)2、站點(diǎn)3,為了確保各站點(diǎn) 能夠知道所傳輸?shù)暮x,在傳送之前對(duì)全局候選頻繁項(xiàng)目集進(jìn)行處理,如將{傾斜度= 01100,疾病 1}處理成 000000000001100000000000000000000001000,運(yùn)樣各站點(diǎn)就不需了 解各位的含義。
[0142] ④各站點(diǎn)掃描其上經(jīng)屬性二進(jìn)制化后的結(jié)果表,求得C2中各項(xiàng)目集在各站點(diǎn)的支 持度(只需進(jìn)行或操作),如站點(diǎn)1上的001條記錄是0101001001010110100100001101000110 01010,由于010100100101011010010000110100011001010或00000000000110000000000000 0000000001000 聲 010100100101011010010000110100011001010,所 W 該記錄不支持該項(xiàng)目 集。計(jì)算結(jié)束后,各站點(diǎn)將其傳送給主機(jī)S。
[0143] ⑤主機(jī)根據(jù)最小支持度闊值mins叩生成全局頻繁2-項(xiàng)目集L2dL2={{均值= 01000,疾病2},{方差= 01011,疾病2},{傾斜度= 01011,疾病2},……,{:均值= 01000,疾病 1},{峰態(tài)= 01001,疾病4},……}。
[0144] ⑥根據(jù)L2生成同時(shí)包含標(biāo)簽屬性和非標(biāo)簽屬性的全局候選頻繁3-項(xiàng)目集C3,將全 局候選頻繁3-項(xiàng)目集C3傳送給站點(diǎn)1、站點(diǎn)2、站點(diǎn)3,各站點(diǎn)掃描對(duì)應(yīng)表一次,求得C3中各項(xiàng) 目集在各站點(diǎn)的支持度,各站點(diǎn)將其傳送給主機(jī)S,主機(jī)S根據(jù)最小支持度闊值minsup生成 全局頻繁3-項(xiàng)目集L3。依次分別求得L4、Ls、…...、Lk,其結(jié)束條件為:根據(jù)Lk生成同時(shí)包含標(biāo) 簽屬性和非標(biāo)簽屬性的候選化+1)-項(xiàng)目集C(k+1)為空集。
[0145] ⑦收集前面的結(jié)果,得到全局頻繁項(xiàng)目集L,L=i王,。
[0146] L={{均值= 01000,方差= 01011,傾斜度= 01011,峰態(tài)= 01001,能量= 00011,聚 類特征= 01100,疾病2},{均值= 01011,方差= 01010,傾斜度= 01100,峰態(tài)= 00110,疾病 4},{均值= 01000,方差= 01011,傾斜度= 01011,峰態(tài)= 01001,疾病1,疾病2,疾病4},{:均 值= 01010,方差= 01001,傾斜度=01100,峰態(tài)= 01000,能量= 00100,聚類特征= 01110, 疾病2,疾病4},......}。
[0147] (6)多標(biāo)簽關(guān)聯(lián)分類規(guī)貝IJMLACR的構(gòu)造(由主機(jī)S來完成)
[0148] 多標(biāo)簽關(guān)聯(lián)分類規(guī)則的構(gòu)造分為多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR的構(gòu)造和多標(biāo) 簽關(guān)聯(lián)分類規(guī)則MLACR的生成。
[0149] 設(shè)最小置信度闊值minconf為0.6,多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR的構(gòu)造包括W 下步驟:
[0150] ①構(gòu)造多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR中各分類規(guī)則的前件和后件,前件即為L 中全局頻繁項(xiàng)目集所包含的非標(biāo)簽屬性集,后件即為L中全局頻繁項(xiàng)目集所包含的標(biāo)簽屬 性集。如項(xiàng)目集{均值= 01000,方差= 01011,傾斜度= 01011,峰態(tài)= 01001,能量= 00011, 聚類特征=01100,疾病2}的前件、后件分別為{均值=01000,方差=01011,傾斜度= 01011,峰態(tài)= 01001,能量= 00011,聚類特征= 01100巧日{(diào)疾病2};項(xiàng)目集{均值= 01011,方 差= 01010,傾斜度= 01100,峰態(tài)= 00110,疾病4}的前件、后件分別為{均值= 01011,方差 = 01010,傾斜度= 01100,峰態(tài)= 00110巧日{(diào)疾病4};項(xiàng)目集{均值= 01000,方差= 01011,傾 斜度= 01011,峰態(tài)= 01001,疾病1,疾病2,疾病4}的前件、后件分別為{均值= 01000,方差 = 01011,傾斜度= 01011,峰態(tài)= 01001}和{疾病1,疾病2,疾病4}。其余全局頻繁項(xiàng)目集作 同樣處理,由此得到初始的多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR。
[ow] mLFCAR= {{均值= 01000,方差= 01011,傾斜度= 01011,峰態(tài)= 01001,能量= 00011,聚類特征=01100}二{疾病巧,{:均值二01011,方差= 10,傾斜度=01100,峰態(tài) =00110}二·[疾病 4},I 均值=01000,方差=01011,傾斜度=01011,峰態(tài)=01001}馬{疾 病1,疾病2,疾病4},{均值=10,方差= 01001,傾斜度= 01100,峰態(tài)= 01000,能量= 00100,聚類特征=01110}二{疾滴 2,疾摘 4},...... }。
[0152] ②分別計(jì)算MLFCAR中各分類規(guī)則的置信度。規(guī)則P^R的置信度計(jì)算公式為: Count(P U Q)/Count(P),Count(P U Q)、Count(P)的具體值已在頻繁項(xiàng)目集L的挖掘過程中 求得。如規(guī)則{均值= 01000,方差= 01011,傾斜度= 01011,峰態(tài)= 01001,能量= 00011, 聚類特征=〇π〇〇}二{疾病巧的置信度為:Count ({均值=01000,方差=01011,傾斜度= 01011,峰態(tài)= 01001,能量= 00011,聚類特征= 01100,疾病2} )/Count({均值= 01000,方差 = 01011,傾斜度= 01011,峰態(tài)= 01001,能量= 00011,聚類特征= 01100} ),Count({均值= 01000,方差= 01011,傾斜度= 01011,峰態(tài)= 01001,能量= 00011,聚類特征= 01100,疾病 2} ) = 17,Count({均值= 01000,方差= 01011,傾斜度= 01011,峰態(tài)= 01001,能量= 00011, 聚類特征= 01100} ) = 20,其置信度為17/20,即為0.85。按同樣方法可計(jì)算出MLFCAR其他分 類規(guī)則的置信度。
[0153] ③刪除MLFCAR中置信度小于0.6的分類規(guī)則,構(gòu)造最終的多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī) 貝IJMLFCAR,由此可得MLFCAR。
[0154] mLFCAR= {{均值= 01000,方差= 01011,傾斜度= 01011,峰態(tài)= 01001,能量= 00011,聚類粹征=01100}二{疾病2},(均值=01000,方差=01011,傾斜度=01011,峰態(tài) =010〇n二·!疾病1,疾病2,疾病4},{均值= 10,方差= 01001,傾斜度= 01100,峰態(tài)= 01000,能量=00100,聚類特征=01110}二(疾病2,疾病 4},一.,. }。
[0155] ④對(duì)MLFCAR進(jìn)行約簡,刪除MLFCAR中的部分多余規(guī)則,比如說MLFCAR中的第一條 規(guī)則就是多余的,據(jù)此可得多標(biāo)簽關(guān)聯(lián)分類規(guī)則MLACR。
[0156] MLACR={{均值= 01000,方差= 01011,傾斜度= 01011,峰態(tài)=01001 }=>{疾病 1, 疾病2,疾病4},I均值= 01010,方差= 01001,傾斜度= 01100,峰態(tài)= 01000,能量= 00100, 聚類特征=01110}疾病2,疾病4], ....,4。
[0157] (7)圖像的識(shí)別
[0158] 對(duì)于一幅未知標(biāo)簽集的圖像t,經(jīng)預(yù)處理、圖像分割、特征提取、特征值離散化后得 到其對(duì)應(yīng)的離散特征值Vt。
[0159] 如 Vt={均值= 01000,方差= 01011,傾斜度= 01011,峰態(tài)= 01001,峰態(tài)= 01001, 能量= 01010,賭= 01010,聚類特征= 01101},Vt包含MLACR中第一條規(guī)則的前件,因此圖像 t的標(biāo)簽集即為該規(guī)則的后件,其標(biāo)簽集為{疾病1,疾病2,疾病4},即該圖像可能同時(shí)包含 與"疾病Γ、"疾病2"、"疾病3"相關(guān)的信息。
[0160] 如 Vt={均值= 01000,方差= 01001,傾斜度= 01100,峰態(tài)= 01000,峰態(tài)= 01001, 能量= 01010,賭= 01010,聚類特征= 01110},由于MLACR中所有規(guī)則前件中不存在被Vt包 含的規(guī)則,對(duì)此取前件與Vt交叉最多的規(guī)則,即規(guī)則{均值=01010,方差=01001,傾斜度= 01100,峰態(tài)= 01000,能量= 00100,聚類特征=0]] 10}與>!疾病么,疾病4),該圖像可能同時(shí) 包含與"疾病2"、"疾病4"相關(guān)的信息。
[0161] 本實(shí)施例是一種醫(yī)學(xué)圖像的識(shí)別過程,該方法還可W應(yīng)用其他與之類似的圖像識(shí) 別領(lǐng)域,如專利中的附圖數(shù)據(jù)等。
【主權(quán)項(xiàng)】
1. 一種基于關(guān)聯(lián)規(guī)則的分布式多標(biāo)簽圖像識(shí)別方法,包括全局候選頻繁項(xiàng)目集的生 成、支持?jǐn)?shù)的計(jì)算以及圖像識(shí)別步驟,其特征在于:所述全局候選頻繁項(xiàng)目集的生成、支持 數(shù)的計(jì)算和圖像識(shí)別步驟包括: 步驟1分布式圖像樣本數(shù)據(jù)集的準(zhǔn)備和預(yù)處理,包括各站點(diǎn)訓(xùn)練圖像格式轉(zhuǎn)換、尺度 歸一化、去噪、增強(qiáng); 步驟2各站點(diǎn)采用基于密度聚類的圖像分割方法分別識(shí)別出每幅訓(xùn)練圖像的待識(shí)別 區(qū)域; 步驟3各站點(diǎn)分別提取每幅訓(xùn)練圖像中待識(shí)別區(qū)域的特征,構(gòu)造各站點(diǎn)的訓(xùn)練圖像樣 本數(shù)據(jù)集DBi,所述圖像樣本數(shù)據(jù)集DBi的模式為關(guān)系模式R(Ai, . ,Αρ,Βι, .,Bq),其中p和q分 別為非標(biāo)簽屬性和標(biāo)簽屬性的個(gè)數(shù),^,.,AP為非標(biāo)簽屬性的屬性名,B 1;.,Bq為標(biāo)簽屬性的 屬性名,i = 1,2,…,η??偟挠?xùn)練樣本集DB = DB! U DB2 U……U DBn,DBi門DBj = Φ,i乒j ; 步驟4特征值離散化,各站點(diǎn)分別對(duì)連續(xù)屬性進(jìn)行離散化; 步驟5全局頻繁項(xiàng)目集L的挖掘; 步驟6多標(biāo)簽關(guān)聯(lián)分類規(guī)則MLACR的構(gòu)造,所述多標(biāo)簽關(guān)聯(lián)分類規(guī)則MLACR的構(gòu)造分為 多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR的構(gòu)造和多標(biāo)簽關(guān)聯(lián)分類規(guī)則MLACR的生成,其步驟包括: 步驟6.1構(gòu)造多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則的前件P和后件Q,其中:所述前件為全局頻繁 項(xiàng)目集L中所包含的非標(biāo)簽屬性集,所述后件為全局頻繁項(xiàng)目集L中所包含的標(biāo)簽屬性集; 步驟6.2分別計(jì)算多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR中各分類規(guī)則的置信度,其中規(guī)則 的置信度計(jì)算公式為:Count(PU Q)/Count(P); 步驟6.3刪除多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR中置信度小于minconf的分類規(guī)則,構(gòu) 造最終的多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR,其中minconf為最小置信度閾值; 步驟6.4對(duì)多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR進(jìn)行約簡,得到多標(biāo)簽關(guān)聯(lián)分類規(guī)則 MLACR; 步驟7圖像識(shí)別。2. 根據(jù)權(quán)利要求1所述的一種基于關(guān)聯(lián)規(guī)則的分布式多標(biāo)簽圖像識(shí)別方法,其特征在 于:所述步驟5的具體步驟包括: 步驟5.1初始化,其包括: 步驟5.1.1選擇η個(gè)站點(diǎn)Si、S2、......、Sn中一個(gè)站點(diǎn)或其它獨(dú)立主機(jī)作為主計(jì)算機(jī)(記 為站點(diǎn)S); 步驟5.1.2各站點(diǎn)分別將其上的訓(xùn)練圖像樣本數(shù)據(jù)DBi轉(zhuǎn)換成二進(jìn)制形式的數(shù)據(jù)庫,為 方便起見這里仍記為DB1; 步驟5.1.3設(shè)置08中的非標(biāo)簽屬性集見4和標(biāo)簽屬性集1^小1^={41,.^1)},1^ = {Bl,.,Bq}; 步驟5.1.4各站點(diǎn)分別統(tǒng)計(jì)非標(biāo)簽屬性集NLA和標(biāo)簽屬性集LA中各屬性的支持?jǐn)?shù),并 將其支持?jǐn)?shù)發(fā)給主機(jī)S; 步驟5.1.5主機(jī)計(jì)算標(biāo)簽屬性中的全局頻繁1-項(xiàng)目集LLi = {ceLA| sup(c)彡minsup}; 步驟5.1.6主機(jī)計(jì)算非標(biāo)簽屬性中的全局頻繁1-項(xiàng)目集NLLi = {c eNLA I sup(c)彡 minsup}; 步驟5.1.7主機(jī)計(jì)算DB中的全局頻繁1-項(xiàng)目集1^ = 0^ U NLU; 其中:minsup為給定的最小支持度閾值;c為給定項(xiàng)目集;Count(c)為支持?jǐn)?shù),是項(xiàng)目集 c在DB中出現(xiàn)的次數(shù);Sup (c)為支持度,Sup (c) = Count (c) / | DB |,| DB |表示總訓(xùn)練圖像樣本 數(shù)據(jù)集DB中樣本的個(gè)數(shù); 步驟5.2全局候選頻繁項(xiàng)目集的生成(由主機(jī)S來完成),其包括: 步驟5.2.1根據(jù)全局頻繁k-項(xiàng)目集Lk生成全局候選頻繁(k+1)-項(xiàng)目集Ck+1,其中k為全 局頻繁項(xiàng)目集的長度; 步驟5.2.2各站點(diǎn)計(jì)算全局候選頻繁項(xiàng)目集Ck+1中各項(xiàng)目集的支持?jǐn)?shù); 步驟5.2.3主機(jī)統(tǒng)計(jì)全局候選頻繁項(xiàng)目集Ck+沖各項(xiàng)目集的支持?jǐn)?shù),并根據(jù)最小支持 度閾值minsup生成全局頻繁(k+l)_項(xiàng)目集Lk+i; 步驟5.2.4重復(fù)步驟5.2.1、步驟5.2.2、步驟5.2.3,若生成全局候選頻繁項(xiàng)目集為空, 則進(jìn)入步驟5.3;3. 根據(jù)權(quán)利要求1所述的一種基于關(guān)聯(lián)規(guī)則的分布式多標(biāo)簽圖像識(shí)別方法,其特征在 于:所述步驟7的具體步驟包括: 步驟7.1待識(shí)別圖的準(zhǔn)備和預(yù)處理,包括訓(xùn)練圖像格式轉(zhuǎn)換、尺度歸一化、去噪和增 強(qiáng); 步驟7.2主機(jī)采用基于密度聚類的圖像分割方法識(shí)別出所述待識(shí)別圖像的待識(shí)別區(qū) 域; 步驟7.3提取出所述待識(shí)別圖像中待識(shí)別區(qū)域的非標(biāo)簽屬性特征; 步驟7.4非標(biāo)簽屬性特征值離散化; 步驟7.5根據(jù)多標(biāo)簽關(guān)聯(lián)分類規(guī)則MLACR識(shí)別所述待識(shí)別圖像的標(biāo)簽屬性。4. 根據(jù)權(quán)利要求1所述的一種基于關(guān)聯(lián)規(guī)則的分布式多標(biāo)簽圖像識(shí)別方法,其特征在 于:所述步驟5.2.1的具體步驟包括: 步驟5.2.1.1選擇全局頻繁k-項(xiàng)目集Lk中的任意兩個(gè)不同項(xiàng)目集cdPc2,如果所述cdP c2的或運(yùn)算結(jié)果中包含且只包含k+1個(gè)1,則Ck+i+= {C1 U C2}; 步驟5.2.1.2重復(fù)步驟5.2.1.1,直到完成所有的項(xiàng)目集對(duì)比較,得到全局候選頻繁(k +1項(xiàng)目集Ck+i; 步驟5.2.1.3對(duì)Ck+1中任意項(xiàng)目集c,如果所述項(xiàng)目集c存在長度為k的子集c3,且ck U, 刪除所述項(xiàng)目集c; 步驟5.1.2.4刪除Ck+1*只包含標(biāo)簽屬性或非標(biāo)簽屬性的項(xiàng)目集。5. 根據(jù)權(quán)利要求1所述的一種基于關(guān)聯(lián)規(guī)則的分布式多標(biāo)簽圖像識(shí)別方法,其特征在 于:所述步驟6.4的具體步驟包括: 步驟6.4.1選擇多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR中前件長度最短的規(guī)則R1; 步驟6.4.2計(jì)算]\0^0?=]\0^0^{1?1}; MLFCAR=MLFCAR-{Ri}; 步驟6.4.3對(duì)于每個(gè)多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR中的規(guī)則R,如果規(guī)則R1覆蓋規(guī) 則R,則執(zhí)行 MLFCAR=MLFCAR-{R}; MLACR=MLACRU {R}; 步驟6.4.4如果多標(biāo)簽頻繁關(guān)聯(lián)分類規(guī)則MLFCAR不為空,重復(fù)執(zhí)行步驟6.4.1至步驟 6.4.4。 所述步驟6.4.3中的規(guī)則1?1覆蓋規(guī)則1?是指對(duì)于多標(biāo)簽關(guān)聯(lián)分類規(guī)則1?1:;^(51和1? : P2々Q2,滿足Ρ]?ΞΡ2, QqQz,其中P1和Q1分別為規(guī)則R1的前件和后件,P2和Q2分別為規(guī)則 R的前件和后件。6.根據(jù)權(quán)利要求1所述一種基于關(guān)聯(lián)規(guī)則的分布式多標(biāo)簽圖像識(shí)別方法,其特征在于: 所述步驟3的非標(biāo)簽屬性包括均值、方差、傾斜度、峰態(tài)、能量、熵和聚類特征。
【文檔編號(hào)】G06K9/62GK105825226SQ201610141659
【公開日】2016年8月3日
【申請(qǐng)日】2016年3月11日
【發(fā)明人】彭彥, 朱玉全, 李競, 何峰, 余飛
【申請(qǐng)人】江蘇暢遠(yuǎn)信息科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1