一種基于稀疏表示的視覺顯著性檢測方法

文檔序號：10688025閱讀：1068來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于稀疏表示的視覺顯著性檢測方法
【專利摘要】本發(fā)明公開了一種基于稀疏表示的視覺顯著性檢測方法，首先，通過鑒別性字典學(xué)習(xí)和分析，對字典中包含顯著性特征的原子和不含顯著性特征的原子進(jìn)行分類，從而構(gòu)建得到多個鑒別性字典；其次，通過對各圖像塊在鑒別性字典下的稀疏編碼系數(shù)的分析，對各圖像塊所屬的類別進(jìn)行分類，區(qū)分出含有視覺顯著性特征的前景圖像塊和不含顯著性特征的背景圖像塊；然后，通過對各圖像塊的稀疏重建誤差的分析，從鑒別性字典中去除對前景圖像塊重構(gòu)能力強(qiáng)，而對背景圖像塊重構(gòu)能力弱的原子；最后，進(jìn)行顯著圖計算。本發(fā)明通過深入挖掘稀疏表示模型本身來實(shí)現(xiàn)視覺顯著性檢測，故可以獲得比傳統(tǒng)基于稀疏表示的顯著性檢測方法更加精確的結(jié)果。
【專利說明】
一種基于稀疏表示的視覺顯著性檢測方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及一種在深入分析稀疏表示模型特征的情況下，對場景中的顯著性目標(biāo) 進(jìn)行精確檢測的方法，屬于計算機(jī)視覺技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 視覺顯著性檢測在目標(biāo)檢測、目標(biāo)識別、圖像修復(fù)等領(lǐng)域得到了廣泛的應(yīng)用，它是模式識別、計算機(jī)視覺學(xué)科的一個重要研究內(nèi)容，對其的研究具有非常重要的理論與實(shí)際意義。隨著稀疏表示理論的不斷發(fā)展，很多基于稀疏表示的顯著性檢測方法正在被研究學(xué) 者們不斷提出。然而，很多基于稀疏表示的顯著性檢測方法沒有充分挖掘過完備字典、稀疏編碼系數(shù)以及稀疏重建誤差等特征，故無法取得十分理想的顯著性檢測結(jié)果。
[0003] 目前大多數(shù)基于稀疏表示的顯著性檢測方法是在一個局部或全局范圍內(nèi)用周圍圖像塊作為字典來對中心圖像塊進(jìn)行稀疏重構(gòu)，然后用稀疏表示誤差來判斷中心圖像塊相對于周圍圖像塊的顯著性。然而，這些方法只是簡單地根據(jù)周邊區(qū)域圖像塊對中心圖像塊的重構(gòu)誤差來判斷中心圖像塊的顯著性強(qiáng)弱，沒有深入挖掘稀疏表示模型本身所包含的特征。
[0004] 公開號為CN104392463A的一種基于聯(lián)合稀疏多尺度融合的圖像顯著區(qū)域檢測方法，首先在不同尺度下對訓(xùn)練圖像集進(jìn)行字典訓(xùn)練，得到不同尺度下的字典。接著，對測試圖像中的每一個像素點(diǎn)取圖像塊，聯(lián)合稀疏求解該圖像塊在各個尺度下的稀疏表示系數(shù)。然后，將稀疏表示系數(shù)作為特征，進(jìn)行顯著性的計算。最后，融合多個尺度下的顯著結(jié)果得到最終的顯著圖。
[0005] Zhu等人在2014年Image and Vision Computing上發(fā)表論文"Ensemble dictionary learning for saliency detection"，該方法通過分析挖掘過完備字典的特征來實(shí)現(xiàn)對圖像顯著性區(qū)域的檢測。
[0006] Xia等人在2015年P(guān)attern Recognition上發(fā)表論文"Nonlocal center-surround reconstruction-based bottom-up saliency estimation"，該方法通過將待測圖像塊周圍的多個圖像塊作為過完備字典，來對中心圖像塊進(jìn)行稀疏重建，而后，利用稀疏重建誤差來判斷待測圖像塊的顯著性強(qiáng)弱。
[0007] 總之，現(xiàn)有的基于稀疏表示的顯著性檢測方法，其存在的局限性主要表現(xiàn)在：
[0008] 大多數(shù)基于稀疏表示的顯著性檢測方法是在一個局部或全局范圍內(nèi)用周圍圖像塊作為字典來對中心圖像塊進(jìn)行稀疏重構(gòu)，然后，通過稀疏表示誤差來判斷中心圖像塊相對于周圍圖像塊的顯著性，它們沒有深入挖掘過完備字典和稀疏編碼系數(shù)本身所包含的特征，因此無法取得理想的顯著性檢測結(jié)果。

【發(fā)明內(nèi)容】

[0009] 發(fā)明目的：針對現(xiàn)有技術(shù)中存在的問題，本發(fā)明提供一種基于稀疏表示的視覺顯著性檢測方法。該方法通過深入挖掘稀疏表示模型中過完備字典、稀疏編碼系數(shù)和稀疏重建誤差的特征來實(shí)現(xiàn)對顯著性的精確檢測。
[0010]技術(shù)方案:一種基于稀疏表示的視覺顯著性檢測方法，包括如下步驟：
[0011] (1)步驟一:通過鑒別性字典學(xué)習(xí)和分析，對字典中包含顯著性特征的原子和不含顯著性特征的原子進(jìn)行分類，從而構(gòu)建得到多個鑒別性字典。
[0012] 先基于隨機(jī)采樣的多字典學(xué)習(xí)。首先，在每一次隨機(jī)采樣過程中，用一個中心處于圖像區(qū)域內(nèi)部任意像素位置，大小為HiXn的窗口對待測圖像進(jìn)行隨機(jī)采樣，得到一組小圖像塊S= [S1，…，SK]。其中，S1ERmxn代表第i個圖像塊，K為圖像塊的總數(shù)。接著，提取每個圖像塊的特征。在視覺注意機(jī)制模型中，由于ICOPPQntensity color opponent)特征可以實(shí) 現(xiàn)對圖像的良好表示，故本文用ICOPP模型來提取每個圖像塊的特征，從而得到特征矩陣F =比，~力]^^。其中土代表圖像塊 81的特征列向量。然后，對特征矩陣每一列進(jìn)行歸一化操作，從而得到過完備字典DeRPXK(K>p)。字典D中的每個原子Cl 1是一個模值為1的單位向量。具體的歸一化過程如下式所示：
[0013]
[0014] 最后，重復(fù)上述步驟Ns次，從而得到Ns個過完備字典D，每個過完備字典用Di表示，i = 1，···，Ν8。其中，每一個字典都是通過一組經(jīng)獨(dú)立隨機(jī)采樣獲得的圖像塊訓(xùn)練得到。Ns的值越大，雖然算法的檢測效果越理想，但是運(yùn)算量也越大。故綜合考慮算法性能和效率，取N s =4〇
[0015] 下面進(jìn)行基于原子內(nèi)積的字典原子分類。第一，計算字典D中每個原子相對于其它所有原子的內(nèi)積和，即：
[0016]
[0017]其中，P1代表第i個原子Cl1相對于其它所有原子的內(nèi)積總和，〈·，·>表示內(nèi)積運(yùn) 算。故對于字典D，通過上述運(yùn)算可以得到一個內(nèi)積和集合P=[P1，…，Ρκ]。第二，由于字典中顯著性原子的個數(shù)遠(yuǎn)遠(yuǎn)小于非顯著性原子的個數(shù)，故顯著性原子的內(nèi)積和將會明顯小于非顯著性原子的內(nèi)積和?；谶@個假設(shè)，可以通過如下方法來區(qū)分出字典中的顯著性原子和非顯著性原子： ,[顯著性原子，（如果:巧屬于P中&個最小值中的一個)：
[_] 非顯著性原子，（其它）
[0019] 其中，選取的顯著性原子的數(shù)量值設(shè)為Ks = K X salAtomRatio，salAtomRatio e [0，1]代表選取的顯著性原子數(shù)量占整個字典原子數(shù)量的百分比。由于顯著性原子的數(shù)量明顯低于非顯著性原子的數(shù)量，且確保Ks為整數(shù)，故設(shè)SalAtomRatio = O. 15。第三，將顯著性原子和非顯著性原子分別存入顯著性原子集&和非顯著性原子集 e Q最后，可以求得一個新字典Dnew，即：
[0020] Dnew= [salAtomSet,nonsalAtomSet] e RpXK
[0021] 由于字典Dnew中的每個原子都有一個標(biāo)簽，故字典Dnew具有鑒別能力。因此，通過對字典A，'··,?進(jìn)行原子內(nèi)積分析，最終可以得到Ns個鑒別性字典飾叫，·· ?
[0022] (2)步驟二:通過對各圖像塊在鑒別性字典下的稀疏編碼系數(shù)的分析，對各圖像塊所屬的類別進(jìn)行分類，區(qū)分出含有視覺顯著性特征的前景圖像塊和不含顯著性特征的背景圖像塊。
[0023]先對待測圖像中的所有圖像塊進(jìn)行稀疏編碼。第一，將輸入圖像分割為N個不重疊的圖像塊Y=[yi，…，yN]，其中，yieRmXn為第i個圖像塊。第二，提取每個圖像塊的ICOPP特征，從而可以得到一個特征矩陣G= [gl，…；gN] GRPxn。其中，gl代表圖像塊yi的特征向量。第三，用OMP算法求取G在鑒別性字典Dnew下的稀疏編碼系數(shù)X= [X1，…，XN] eRkxn。其中，Xi e Rkx1代表第i個圖像塊的稀疏編碼系數(shù)。
[0024]接下去進(jìn)行基于稀疏編碼系數(shù)分析的顯著性/非顯著性原子鑒別。首先，將每個圖像塊的稀疏編碼系數(shù)11分為8&10〇6；1^和11〇11831(]〇6；1^兩部分。其中，831&36；1^代表屬于顯著性原子集的編碼系數(shù)和，而nonsalCoefJlj代表屬于非顯著性原子集的編碼系數(shù)和。 salCoefi和nonsalCoefi的計算方法如下：
[0025]
[0026]
[0027]其中，Xl(j)代表X1中的第j個元素。然后，比較每個圖像塊yi的顯著性稀疏編碼系數(shù)和salCoefi以及非顯著性稀疏編碼系數(shù)和nonsalCoefi的大小。如果salCoefi> nonsalCoefi，則判定yi為顯著性圖像塊;否則，判定yi屬于非顯著性圖像塊。最后，將所有顯著性圖像塊以及它們的特征向量和稀疏編碼系數(shù)分別存入集合Ysal，Gsal和Xsal。同時將所有非顯著性圖像塊以及它們的特征向量和稀疏編碼系數(shù)分別存入集合YnonsalGnonsal 和Xnonsal〇
[0028] (3)步驟三:通過對各圖像塊的稀疏重建誤差的分析，從鑒別性字典中去除對前景圖像塊重構(gòu)能力強(qiáng)，而對背景圖像塊重構(gòu)能力弱的原子。
[0029]先求取顯著性圖像塊和非顯著性圖像塊的稀疏重建誤差。首先，對于每個鑒別性字典Dnew，逐一去除該字典中顯著性原子集salAtomSet中的原子，并計算顯著性圖像塊集合Ysal和非顯著性圖像塊集合Ynonsal在去除當(dāng)前原子的字典下的稀疏重建誤差。令Dnew=J 代表從Dnew中去除第j列后的子矩陣，其中，KjSKsc 3Ysal和Ynonsal在字典Dnew"下的稀疏重建誤差計算方法如下：
[0030]
[0031]
[0032] 其中，乂8&1-」和乂11〇1^&1-」分別代表￥8&1和￥11〇1^ &1去除第」行后的子矩陣。然后，計算Errsalj和Errnonsalj的加權(quán)差，即：
[0033] Diffj = O XErrsalj-(l-α) XErrnonsaP
[0034] 其中，參數(shù)(Χα<1可以控制Errsalj和Errnonsal j的權(quán)重。
[0035] 下面進(jìn)行基于稀疏重建誤差分析的字典原子去除。第一，將求得的每個加權(quán)差系數(shù)Diff j(l彡j彡Ks)存入加權(quán)差集合Diff。第二，從集合Diff中選出KsXinAtomRatio個值最大的元素，并將其下標(biāo)存入集合A。此時，將鑒別性字典Dnew中具有與集合△中相同下標(biāo)的原子視為顯著性特征非常強(qiáng)的原子。其中，參數(shù)inAt〇mRati〇e[0，l]代表從所有顯著性原子中選出的顯著性特征非常強(qiáng)的原子的比率。第三，從字典Dnew中去除鑒別出的包含強(qiáng)顯著性特征的原子，從而得到去除強(qiáng)顯著性原子后的字典Dnew :A。其中，Dnew:A代表從Dnew中去除具有與集合A中相同下標(biāo)的原子后的子矩陣。
[0036] (4)步驟四：進(jìn)行顯著圖計算。
[0037]先根據(jù)去除強(qiáng)顯著性原子后的字典來生成多個顯著圖。第一，計算每個圖像塊yi e Rmxn在字典Dnew: Λ下的稀疏重建誤差：
[0038]
[0039] 其中，gleRPx^XleRKxl分別代表圖像塊…的特征列向量和稀疏編碼系數(shù)，幸代表從^中去除具有與集合△中相同下標(biāo)的行向量后的子矩陣。第二，將每個圖像塊的重建誤差直接作為該圖像塊的像素值，從而得到粗顯著圖Rawmap。第三，由于每個圖像塊不重疊，故為了克服分塊效應(yīng)，用一個高斯濾波器對粗顯著圖進(jìn)行濾波操作，即：map = g*Rawmap。其中，map代表初始顯著圖，g是一個標(biāo)準(zhǔn)差為〇的二維高斯濾波器。最后，由于具有Ns個去除強(qiáng) 顯著性原子后的字典，…,，可以得到N s個初始顯著圖· ·，_&。
[0040] 下面進(jìn)行基于初始顯著圖加權(quán)融合的最終顯著圖計算。將得到的初始顯著圖 [00411 mapi(i = 1，…,Ns)進(jìn)行加權(quán)相加，從而得到最終顯著圖MAP，即：
[0042]
[0043]其中，W1代表每幅初始顯著圖的權(quán)重系數(shù)。
[0044] 本發(fā)明采用上述技術(shù)方案，具有以下有益效果：
[0045] (1)本發(fā)明的方法通過對過完備字典的分析，對字典中包含顯著性特征的原子和不含顯著性特征的原子進(jìn)行了有效的分類，從而可以大大增強(qiáng)字典對顯著性區(qū)域和非顯著性區(qū)域的鑒別能力；
[0046] (2)本方法通過對稀疏編碼系數(shù)以及稀疏重建誤差的分析，有效區(qū)分出含有視覺顯著性特征的前景圖像塊和不含顯著性特征的背景圖像塊，并從字典中去除了對前景圖像塊重構(gòu)能力強(qiáng)，而對背景圖像塊重構(gòu)能力弱的原子，從而提高了顯著性檢測的精度。
【附圖說明】
[0047]圖1為本發(fā)明實(shí)施例的框架圖。
【具體實(shí)施方式】
[0048]下面結(jié)合具體實(shí)施例，進(jìn)一步闡明本發(fā)明，應(yīng)理解這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍，在閱讀了本發(fā)明之后，本領(lǐng)域技術(shù)人員對本發(fā)明的各種等價形式的修改均落于本申請所附權(quán)利要求所限定的范圍。
[0049]如圖1所示，進(jìn)一步的詳細(xì)描述如下：
[0050]首先，進(jìn)行鑒別性字典學(xué)習(xí)和分析。具體包括如下兩個步驟：
[0051 ] (1)基于隨機(jī)采樣的多字典學(xué)習(xí)。
[0052]首先，在每一次隨機(jī)采樣過程中，用一個中心處于圖像區(qū)域內(nèi)部任意像素位置，大小為mXη的窗口對待測圖像進(jìn)行隨機(jī)采樣，得到一組小圖像塊S= [si,…，sk]。其中，SiGRm Xn代表第i個圖像塊，K為圖像塊的總數(shù)。接著，用ICOPP模型來提取每個圖像塊的特征，從而得到特征矩陣？=比，~，妃￡1^ 1(。其中41代表圖像塊81的特征列向量。然后，對特征矩陣每一列進(jìn)行歸一化操作，從而得到過完備字典DeRP XK(K>p)。字典D中的每個原子Cl1是一個模值為1的單位向量。具體的歸一化過稈如下式所示：
[0053]
[0054]最后，重復(fù)上述步驟Ns次，從而得到Ns個過完備字典Di，i = 1，…，Ns。其中，每一個字典都是通過一組經(jīng)獨(dú)立隨機(jī)采樣獲得的圖像塊訓(xùn)練得到。隊(duì)的值越大，雖然算法的檢測效果越理想，但是運(yùn)算量也越大。故綜合考慮算法性能和效率，取N s = 4。
[0055] (2)基于原子內(nèi)積的字典原子分類。
[0056] 第一，計算字典D中每個原子相對于其它所有原子的內(nèi)積和，即：
[0057]
[0058] 其中，P1代表第i個原子Cl1相對于其它所有原子的內(nèi)積總和，〈·，·>表示內(nèi)積運(yùn) 算。故對于字典D，通過上述運(yùn)算可以得到一個內(nèi)積和集合P=[ P1，…，Ρκ]。第二，由于字典中顯著性原子的個數(shù)遠(yuǎn)遠(yuǎn)小于非顯著性原子的個數(shù)，故顯著性原子的內(nèi)積和將會明顯小于非顯著性原子的內(nèi)積和?；谶@個假設(shè)，可以通過如下方法來區(qū)分出字典中的顯著性原子和非顯著性原子： ,f顯著性原子，（如果&屬于P中A：s個最小值中的一個）
[0059] d- e i ' ? f 1非顯著性原子，（其它）
[0060] 其中，選取的顯著性原子的數(shù)量值設(shè)為Ks = K X salAtomRatio，salAtomRatio e
[0，1]代表選取的顯著性原子數(shù)量占整個字典原子數(shù)量的百分比。由于顯著性原子的數(shù)量明顯低于非顯著性原子的數(shù)量，且確保Ks為整數(shù)，故設(shè)SalAtomRatio = O. 15。第三，將顯著性原子和非顯著性原子分別存入顯著性原子集畑和非顯著性原子集 /?〇/?.、丫///1_;5^/· e 最后，可以求得一個新字典Dnew，即：
[0061 ] Dnew= [ salAtomSet, nonsalAtomSet ] e RpXK
[0062] 由于字典Dnew中的每個原子都有一個標(biāo)簽，故字典Dnew具有鑒別能力。因此，通過對字典1V ··，Avi進(jìn)行原子內(nèi)積分析，最終可以得到Ns個鑒別性字典Dwv1，…，DnW 7vs。
[0063] 接著，對稀疏編碼系數(shù)進(jìn)行分析，主要包括下面(3)-(4)這兩個步驟。
[0064] (3)對待測圖像中的所有圖像塊進(jìn)行稀疏編碼。
[0065]第一，將輸入圖像分割為N個不重疊的圖像塊Y=[yi,…，yN]，其中，yieRmXn為第i 個圖像塊。第二，提取每個圖像塊的ICOPP特征，從而可以得到一個特征矩陣G= [gl，…；gN] GRpxn。其中，gi代表圖像塊yi的特征向量。第三，用OMP算法求取G在鑒別性字典Dnew下的稀疏編碼系數(shù)X= [X1，…，xn] e Rkxn。其中，Xl e Rkx1代表第i個圖像塊的稀疏編碼系數(shù)。
[0066] (4)基于稀疏編碼系數(shù)分析的顯著性/非顯著性原子鑒別。
[0067]首先，將每個圖像塊的稀疏編碼系數(shù)Xi分為SalCoefi和nonsalCoefi兩部分。其中， salCoefi代表屬于顯著性原子集的編碼系數(shù)和，而nonsalCoefi則代表屬于非顯著性原子集
[0068] 的編碼系數(shù)和。salCoefi和nonsalCoefi的計算方法如下：
[0069]
[0070]其中，Xl(j)代表X1中的第j個元素。然后，比較每個圖像塊yi的顯著性稀疏編碼系數(shù)和salCoefi以及非顯著性稀疏編碼系數(shù)和nonsalCoefi的大小。如果salCoefi> nonsalCoefi，則判定yi為顯著性圖像塊;否則，判定yi屬于非顯著性圖像塊。最后，將所有顯著性圖像塊以及它們的特征向量和稀疏編碼系數(shù)分別存入集合Ysal，Gsal和Xsal。同時將所有非顯著性圖像塊以及它們的特征向量和稀疏編碼系數(shù)分別存入集合YnonsalGnonsal 和Xnonsal〇
[0071]然后，對稀疏重建誤差進(jìn)行分析。具體包括如下步驟：
[0072] (5)求取顯著性圖像塊和非顯著性圖像塊的稀疏重建誤差。
[0073] 首先，對于每個鑒別性字典Dnew，逐一去除該字典中顯著性原子集salAtomSet中的原子，并計算顯著性圖像塊集合Ysal和非顯著性圖像塊集合Ynonsal在去除當(dāng)前原子的字典下的稀疏重建誤差。令DnewU代表從Dnew中去除第j列后的子矩陣，其中，KjSKs 0 Ysal和Ynonsal在字典Dnew"下的稀疏重建誤差計算方法如下：
[0074]
[0075]
[0076] 其中，乂％1-」和乂11〇11%1-」分別代表￥仰1和￥11〇11%1去除第」行后的子矩陣。然后，計算Errsalj和Errnonsalj的加權(quán)差，即：
[0077] Diffj = O XErrsalj-(l-α) XErrnonsaP
[0078] 其中，參數(shù)(Χα<1可以控制Errsalj和Errnonsal j的權(quán)重。
[0079] (6)基于稀疏重建誤差分析的字典原子去除。
[0080] 第一，將求得的每個加權(quán)差系數(shù)Diffj(KjSKs)存入加權(quán)差集合Diff。第二，從集合0丨€€中選出1( 5\丨1^〇1111^丨〇個值最大的元素，并將其下標(biāo)存入集合八。此時，將鑒別性字典 Dnew中具有與集合△中相同下標(biāo)的原子視為顯著性特征非常強(qiáng)的原子。其中，參數(shù) inAtomRati〇e[0，l]代表從所有顯著性原子中選出的顯著性特征非常強(qiáng)的原子的比率。第三，從字典Dnew中去除鑒別出的包含強(qiáng)顯著性特征的原子，從而得到去除強(qiáng)顯著性原子后的字典Dnew :A。其中，Dnew:A代表從Dnew中去除具有與集合△中相同下標(biāo)的原子后的子矩陣。
[0081] 最后，進(jìn)行顯著圖計算。具體包括如下(7)-(8)這兩個步驟：
[0082] (7)根據(jù)去除強(qiáng)顯著性原子后的字典來生成多個顯著圖。
[0083]第一，計算每個圖像塊yi e Rmxn在字典Dnew:A下的稀疏重建誤差：
[0084]
[0085] 其中，S1GRPx^xieRKxl分別代表圖像塊"的特征列向量和稀疏編碼系數(shù)，^代表從Xi中去除具有與集合A中相同下標(biāo)的行向量后的子矩陣。第二，將每個圖像塊的重建誤差直接作為該圖像塊的像素值，從而得到粗顯著圖Rawmap。第三，由于每個圖像塊不重疊，故為了克服分塊效應(yīng)，用一個高斯濾波器對粗顯著圖進(jìn)行濾波操作，即:map = g*Rawmap。其中，map代表初始顯著圖，g是一個標(biāo)準(zhǔn)差為〇的二維高斯濾波器。最后，由于具有Ns個去除強(qiáng) 顯著性原子后的字典伽廳義，可以得到N s個初始顯著圖爾A 、麵pY [0086] (8)基于初始顯著圖加權(quán)融合的最終顯著圖計算。
[0087]將得到的初始顯著圖maPl(i = l，…，Ns)進(jìn)行加權(quán)相加，從而得到最終顯著圖MAP，即
其中，W1代表每幅初始顯著圖的權(quán)重系數(shù)。
【主權(quán)項(xiàng)】
1. 一種基于稀疏表示的視覺顯著性檢測方法，其特征在于，包括如下步驟：步驟一:通過鑒別性字典學(xué)習(xí)和分析，對字典中包含顯著性特征的原子和不含顯著性特征的原子進(jìn)行分類，從而構(gòu)建得到多個鑒別性字典；步驟二:通過對各圖像塊在鑒別性字典下的稀疏編碼系數(shù)的分析，對各圖像塊所屬的類別進(jìn)行分類，區(qū)分出含有視覺顯著性特征的前景圖像塊和不含顯著性特征的背景圖像塊；步驟三:通過對各圖像塊的稀疏重建誤差的分析，從鑒別性字典中去除對前景圖像塊重構(gòu)能力強(qiáng)，而對背景圖像塊重構(gòu)能力弱的原子；步驟四：進(jìn)行顯著圖計算。2. 根據(jù)權(quán)利要求1所述的基于稀疏表示的視覺顯著性檢測方法，其特征在于，通過鑒別性字典學(xué)習(xí)和分析，對字典中包含顯著性特征的原子和不含顯著性特征的原子進(jìn)行分類，從而構(gòu)建得到多個鑒別性字典，其操作過程如下： (1) 基于隨機(jī)采樣的多字典學(xué)習(xí)；首先，在每一次隨機(jī)采樣過程中，用一個中心處于圖像區(qū)域內(nèi)部任意像素位置，大小為 mXn的窗口對待測圖像進(jìn)行隨機(jī)采樣，得到一組小圖像塊S=[S1，…，SK];其中， SleRmXM 表第i個圖像塊，K為圖像塊的總數(shù)；接著，用ICOPP(intensity color opponent)模型來提取每個圖像塊的特征，從而得到特征矩陣？=比，~，妃^妒'其中41代表圖像塊81的特征列向量；然后，對特征矩陣每一列進(jìn)行歸一化操作，從而得到過完備字典DeRPXK(K>p);字典D 中的每個原子cU是一個模值為1的單位向量。具體的歸一化過程如下式所示：最后，重復(fù)上述步驟Ns次，從而得到Ns個過完備字典D，每個過完備字典用Di表示，i = 1，…，Ns;其中，每一個字典都是通過一組經(jīng)獨(dú)立隨機(jī)采樣獲得的圖像塊訓(xùn)練得到。 (2) 進(jìn)行基于原子內(nèi)積的字典原子分類；第一，計算字典D中每個原子相對于其它所有原子的內(nèi)積和，即：其中，Pi代表第i個原子cU相對于其它所有原子的內(nèi)積總和，〈·，·>表示內(nèi)積運(yùn)算;故對于字典D，通過上述運(yùn)算可以得到一個內(nèi)積和集合P=[P1，…，pk]; 第二，由于字典中顯著性原子的個數(shù)遠(yuǎn)遠(yuǎn)小于非顯著性原子的個數(shù)，故顯著性原子的內(nèi)積和將會明顯小于非顯著性原子的內(nèi)積和;基于這個假設(shè)，可以通過如下方法來區(qū)分出字典中的顯著性原子和非顯著性原子： j顯著性原子，（如果屬于尸中足5個最小值中的一個）非顯著性原子，（其它）其中，選取的顯著性原子的數(shù)量值設(shè)為Ks = KX salAtomRatio，salAtomRatio e [〇，1 ]代表選取的顯著性原子數(shù)量占整個字典原子數(shù)量的百分比；由于顯著性原子的數(shù)量明顯低于非顯著性原子的數(shù)量，且為了確保Ks為整數(shù)，故設(shè)salAtomRatio = 0.15; 第三，將顯著性原子和非顯著性原子分別存入顯著性原子集.犯//^期6>?￡/?〃夂和非顯著性原子集e /?/>χ(λ-; 最后，可以求得一個新字典Dnew，即： Dnew= [salAtomSet ,nonsalAtomSet] eRpXK 由于字典Dnew中的每個原子都有一個標(biāo)簽，故字典01^具有鑒別能力；因此，通過對字典ZV…，、進(jìn)行原子內(nèi)積分析，最終可以得到ns個鑒別性字典￡>?，，:···。3. 根據(jù)權(quán)利要求1所述的基于稀疏表示的視覺顯著性檢測方法，其特征在于，通過對各圖像塊在鑒別性字典下的稀疏編碼系數(shù)的分析，對各圖像塊所屬的類別進(jìn)行分類，其操作過程如下： (1) 對待測圖像中的所有圖像塊進(jìn)行稀疏編碼；第一，將輸入圖像分割為Ν個不重疊的圖像塊Y=[yi，…，yN]，其中，yieR mXn為第i個圖像塊；第二，提取每個圖像塊的IC0PP特征，從而可以得到一個特征矩陣G=[gl，…；gN]eRP XN; 其中，gl代表圖像塊yi的特征向量；第三，用0MP算法求取G在鑒別性字典Dnew下的稀疏編碼系數(shù)X= [X1，…，xn] e RKXN。其中，XleRKxl代表第i個圖像塊的稀疏編碼系數(shù)； (2) 基于稀疏編碼系數(shù)分析的顯著性/非顯著性原子鑒別；首先，將每個圖像塊的稀疏編碼系數(shù)Xi分為salCoefi和nonsalCoefi兩部分；其中， salCoefi代表屬于顯著性原子集的編碼系數(shù)和，而nonsalCoefi則代表屬于非顯著性原子集的編碼系數(shù)和;salCoefi和nonsalCoefi的計算方法如下：其中，xdj)代表X:中的第j個元素；然后，比較每個圖像塊yi的顯著性稀疏編碼系數(shù)和salCoefi以及非顯著性稀疏編碼系數(shù)和nonsalCoefi的大小;如果salCoefi>nonsalCoefi，則判定yi為顯著性圖像塊;否則，判定又:屬于非顯著性圖像塊；最后，將所有顯著性圖像塊以及它們的特征向量和稀疏編碼系數(shù)分別存入集合Ysal， Gsal和Xsal;同時將所有非顯著性圖像塊以及它們的特征向量和稀疏編碼系數(shù)分別存入集合Ynonsal，Gnonsal和Xnonsal〇4. 根據(jù)權(quán)利要求1所述的基于稀疏表示的視覺顯著性檢測方法，其特征在于，通過對各圖像塊的稀疏重建誤差的分析，從鑒別性字典中去除對前景圖像塊重構(gòu)能力強(qiáng)，而對背景圖像塊重構(gòu)能力弱的原子，其操作過程如下： (1)求取顯著性圖像塊和非顯著性圖像塊的稀疏重建誤差；首先，對于每個鑒別性字典Dnew，逐一去除該字典中顯著性原子集salAtomSet中的原子，并計算顯著性圖像塊集合Ysal和非顯著性圖像塊集合Ynonsal在去除當(dāng)前原子的字典下的稀疏重建誤差;令Dnew :j代表從Dnew中去除第j列后的子矩陣，其中，1彡j彡Ks;Ysal和 Ynonsal在字典Dnew"下的稀疏重建誤差計算方法如下：其中，乂8&1^和乂110118&1^分別代表￥8&1和￥110118 &1去除第」行后的子矩陣；然后，計算ErrsaP和ErrnonsaP的加權(quán)差，即： Diffj = α X Errsalj-( 1-α) X ErrnonsaP 其中，參數(shù)(Χα^? 1可以控制Errsalj和Errnonsalj的權(quán)重； (2)基于稀疏重建誤差分析的字典原子去除；第一，將求得的每個加權(quán)差系數(shù)DifTj(l<j<Ks)存入加權(quán)差集合Diff; 第二，從集合Diff中選出KsX inAtomRatio個值最大的元素，并將其下標(biāo)存入集合Δ ;此時，將鑒別性字典Dnew中具有與集合△中相同下標(biāo)的原子視為顯著性特征非常強(qiáng)的原子；其中，參數(shù)inAtomRati〇e[〇，l]代表從所有顯著性原子中選出的顯著性特征非常強(qiáng)的原子的比率；第三，從字典Dnew中去除鑒別出的包含強(qiáng)顯著性特征的原子，從而得到去除強(qiáng)顯著性原子后的字典Dnew:A;其中，Dnew:A代表從Dnew中去除具有與集合△中相同下標(biāo)的原子后的子矩陣。5.根據(jù)權(quán)利要求1所述的基于稀疏表示的視覺顯著性檢測方法，其特征在于，進(jìn)行顯著圖計算： (1) 根據(jù)去除強(qiáng)顯著性原子后的字典來生成多個顯著圖；第一，計算每個圖像塊yi e RmXn在字典Dnew: Λ下的稀疏重建誤差：其中，gl e RPx$PXl e RKX1分別代表圖像塊"的特征列向量和稀疏編碼系數(shù)，Δ代表從Xl 中去除具有與集合△中相同下標(biāo)的行向量后的子矩陣；第二，將每個圖像塊的重建誤差直接作為該圖像塊的像素值，從而得到粗顯著圖 Rawmap；第三，由于每個圖像塊不重疊，故為了克服分塊效應(yīng)，用一個高斯濾波器對粗顯著圖進(jìn) 行濾波操作，即:map = g*Rawmap;其中，map代表初始顯著圖，g是一個標(biāo)準(zhǔn)差為〇的二維高斯濾波器；最后，由于具有Ns個去除強(qiáng)顯著性原子后的字典，可以得到Ns個初始顯著圖瓶奶，…，脫，； (2) 基于初始顯著圖加權(quán)融合的最終顯著圖計算；將得到的初始顯著圖maPl(i = l，"_，Ns)進(jìn)行加權(quán)相加，從而得到最終顯著圖其中，Wl代表每幅初始顯著圖的權(quán)重系數(shù)。
【文檔編號】G06T9/00GK106056592SQ201610356541
【公開日】2016年10月26日
【申請日】2016年5月26日
【發(fā)明人】王鑫, 沈思秋, 張春燕, 周韻, 呂國芳, 徐玲玲
【申請人】河海大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王鑫;沈思秋;張春燕;周韻;呂國芳;徐玲玲;
技術(shù)所有人：河海大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

視覺顯著性檢測相關(guān)技術(shù)

視覺顯著性檢測模型相關(guān)技術(shù)

視覺顯著性相關(guān)技術(shù)

視覺顯著性模型相關(guān)技術(shù)

視覺顯著性算法相關(guān)技術(shù)

顯著性檢測相關(guān)技術(shù)

圖像顯著性檢測相關(guān)技術(shù)

日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種基于稀疏表示的視覺顯著性檢測方法