基于新的鄰域函數(shù)的三維自組織映射圖像編碼方法
【專利摘要】本發(fā)明公開一種基于新的鄰域函數(shù)的三維自組織映射圖像編碼方法,首先,對(duì)圖像樣本進(jìn)行不斷學(xué)習(xí)訓(xùn)練,得到最佳匹配模式庫(kù);其次,對(duì)待編碼的圖像進(jìn)行分塊處理,并將這些待編碼圖像塊與最佳匹配模式庫(kù)中的模式矢量進(jìn)行圖像模式匹配,編碼每個(gè)塊在模式庫(kù)中的匹配模式的索引。本發(fā)明具有模式庫(kù)調(diào)整速度快,模式庫(kù)訓(xùn)練效率高的特點(diǎn)。
【專利說明】
基于新的鄰域函數(shù)的三維自組織映射圖像編碼方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及圖像編碼技術(shù)領(lǐng)域,具體涉及一種基于新的鄰域函數(shù)的三維自組織映 射圖像編碼方法。
【背景技術(shù)】
[0002] 圖像編碼也稱圖像壓縮,是指在滿足一定質(zhì)量(信噪比的要求或主觀評(píng)價(jià)得分)的 條件下,以較少比特?cái)?shù)表示圖像或圖像中所包含信息的技術(shù)?;谏窠?jīng)網(wǎng)絡(luò)的圖像編碼是 近年來出現(xiàn)的一種新的圖像編碼方法。人工神經(jīng)網(wǎng)絡(luò)在圖像壓縮中的應(yīng)用是通過初步模擬 人體神經(jīng)系統(tǒng)的局部初級(jí)功能,根據(jù)圖像本身的特點(diǎn),自主的對(duì)其進(jìn)行壓縮編碼。自組織神 經(jīng)網(wǎng)絡(luò)在圖像編碼鄰域有廣泛的應(yīng)用。
[0003] 自組織映射(361卜0找3]1丨2;[1^]\^1。,簡(jiǎn)稱30]\0算法是1(〇11〇11611從人腦神經(jīng)元的組 織原理上受到啟發(fā)而提出的一種具有自組織特性的人工神經(jīng)網(wǎng)絡(luò)算法。該算法模擬了人腦 神經(jīng)系統(tǒng)對(duì)某一圖形或某一頻率特定興奮的特征,同時(shí)考慮了可以人工實(shí)現(xiàn)的條件,在數(shù) 據(jù)挖掘和圖像模式識(shí)別等領(lǐng)域得到了深入的研究和應(yīng)用,是一種高效的數(shù)據(jù)聚類方法。S0M 網(wǎng)絡(luò)采用雙層網(wǎng)絡(luò)結(jié)構(gòu),分為輸入層和映射層,輸入層用于感知輸入模式,每個(gè)輸入神經(jīng)元 通過權(quán)值與每個(gè)映射層神經(jīng)元連接,映射層輸出結(jié)果,映射層的神經(jīng)元互相連接。傳統(tǒng)S0M 網(wǎng)絡(luò)一般采用一維輸入層和二維映射層,它能有效地處理一維和二維信號(hào)。近年來,三維圖 像和視頻等三維信號(hào)的處理日益引起了關(guān)注,然而傳統(tǒng)S0M算法并不能直接用于三維信號(hào) 的處理。三維S0M算法很好地解決了這一問題,能有效地將二維輸入映射為三維輸出,實(shí)現(xiàn) 了三維信號(hào)的非線性映射。
[0004] 鄰域函數(shù)是S0M算法的重要組成部分,為了保證收斂,需滿足隨迭代時(shí)間逐漸減小 的原則。在訓(xùn)練的初始階段,鄰域半徑較大,隨著訓(xùn)練次數(shù)的增加,網(wǎng)絡(luò)逐漸趨于穩(wěn)定,只需 對(duì)獲勝節(jié)點(diǎn)進(jìn)行較細(xì)微的權(quán)值調(diào)整,因而鄰域半徑不斷縮小。鄰域函數(shù)通常取線性函數(shù)或 指數(shù)函數(shù)。然而,這些鄰域函數(shù)存在一定問題,如模式庫(kù)調(diào)整速度慢,模式庫(kù)訓(xùn)練效率低等, 影響了三維S0M算法的性能。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明所要解決的技術(shù)問題是現(xiàn)有S0M算法的模式庫(kù)調(diào)整速度慢和訓(xùn)練效率低的 問題,提供一種基于新的鄰域函數(shù)的三維自組織映射圖像編碼方法。
[0006] 為解決上述問題,本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:
[0007] 基于新的鄰域函數(shù)的三維自組織映射圖像編碼方法,包括如下步驟:
[0008] 步驟1、對(duì)圖像樣本進(jìn)行不斷學(xué)習(xí)訓(xùn)練,得到最佳匹配模式庫(kù);
[0009] 步驟1.1、對(duì)圖像樣本進(jìn)行分塊,每個(gè)圖像塊為一個(gè)訓(xùn)練矢量,共得到含L個(gè)訓(xùn)練矢 量的訓(xùn)練矢量集;
[0010] 步驟1.2、從訓(xùn)練矢量集中選擇N個(gè)訓(xùn)練矢量來構(gòu)成初始化模式庫(kù),該初始模式庫(kù) 中的訓(xùn)練矢量稱為模式矢量,且初始模式庫(kù)中的模式矢量排列成三維立體結(jié)構(gòu);上述N< < L;
[0011]步驟1.3、設(shè)定鄰域函數(shù)
[0013] 其中,Bo為最小鄰域,為最大鄰域,Q為鄰域衰減常數(shù)、C2為訓(xùn)練次數(shù);j = 0, 1,…,N-1,N為設(shè)定的三維自組織映射網(wǎng)絡(luò)的大?。籺 = 0,1,…,L-1,L為訓(xùn)練矢量集中訓(xùn)練 矢量的個(gè)數(shù);
[0014] 步驟1.4、輸入一個(gè)訓(xùn)練矢量,并分別計(jì)算該訓(xùn)練矢量與初始模式庫(kù)中的各個(gè)模式 矢量的失真,從中選擇出與訓(xùn)練矢量失真最小的模式矢量作為獲勝模式矢量;
[0015] 步驟1.5、調(diào)整獲勝模式矢量及其三維鄰域范圍內(nèi)的模式矢量;
[0016] 步驟1.6、返回步驟1.4重新選擇一個(gè)訓(xùn)練矢量,直到輸入完所有的訓(xùn)練矢量,得到 最佳匹配模式庫(kù);
[0017] 步驟2、對(duì)待編碼的圖像進(jìn)行分塊處理,并將這些待編碼圖像塊與最佳匹配模式庫(kù) 中的模式矢量進(jìn)行圖像模式匹配,編碼每個(gè)塊在模式庫(kù)中的匹配模式的索引。
[0018] 上述步驟1.2中,采用隨機(jī)法從訓(xùn)練矢量集中選擇N個(gè)訓(xùn)練矢量來構(gòu)成初始模式 庫(kù)。
[0019] 上述步驟1.4中,采用下式計(jì)算訓(xùn)練矢量與模式矢量的失真山(t);
[0020] dj(t)=||X(t)-Wj⑴ ||2
[0021] 其中,Wj (t)為模式矢量,X (t)為訓(xùn)練矢量;j = 0,1,…,N-1,N為設(shè)定的三維自組織 映射網(wǎng)絡(luò)的大小;t = 0,1,…,L-l,L為訓(xùn)練矢量集中訓(xùn)練矢量的個(gè)數(shù)。
[0022] 上述步驟1.5中,根據(jù)下式調(diào)整獲勝模式矢量及其三維鄰域范圍內(nèi)的模式矢量
[0024]其中,Wj(t+1)為第t+Ι次訓(xùn)練時(shí)的模式矢量,Wj(t)為第t次訓(xùn)練時(shí)的模式矢量,X (t)為訓(xùn)練矢量,f為獲勝模式矢量,為獲勝模式矢量f在第t次訓(xùn)練時(shí)的鄰域函數(shù),α (t)為第t次訓(xùn)練時(shí)的學(xué)習(xí)速度函數(shù);j = 0,1,…,N-1,Ν為設(shè)定的三維自組織映射網(wǎng)絡(luò)的大 小;t = 0,1,…,L-l,L為訓(xùn)練矢量集中訓(xùn)練矢量的個(gè)數(shù)。
[0025] 上述步驟2具體為:
[0026]步驟2.1、將待編碼的圖像分塊,其中待編碼的圖像分塊大小與圖像樣本的分塊大 小相一致;
[0027] 步驟2.2、分別計(jì)算每一個(gè)待編碼圖像塊與最佳匹配模式庫(kù)中各模式矢量的失真, 并編碼具有最小失真的模式矢量在模式庫(kù)中的索引;
[0028] 步驟2.3、對(duì)待編碼的所有圖像進(jìn)行步驟2.2的處理,得到待編碼的圖像的碼流。
[0029] 與現(xiàn)有技術(shù)相比,本發(fā)明具有如下特點(diǎn):模式庫(kù)調(diào)整速度快,模式庫(kù)訓(xùn)練效率高。
【附圖說明】
[0030] 圖1為模式庫(kù)的訓(xùn)練過程。
[0031] 圖2為三維自組織映射圖像編碼過程。
【具體實(shí)施方式】
[0032]下面結(jié)合實(shí)施例,對(duì)本
【發(fā)明內(nèi)容】
作進(jìn)一步地詳細(xì)說明,但本發(fā)明的實(shí)施方式不限 于此。
[0033] 一種基于新的鄰域函數(shù)的三維自組織映射圖像編碼方法,包括如下步驟:
[0034]步驟1)對(duì)圖像樣本進(jìn)行不斷訓(xùn)練,得到最佳匹配的模式庫(kù)。參見圖1。
[0035]步驟1.1)設(shè)定3DS0M網(wǎng)絡(luò)大小為(N,M),其中N、M分別為模式庫(kù)的大小、模式庫(kù)中模 式矢量的大小。
[0036]步驟1.2)對(duì)圖像樣本分塊,塊的大小一般取8X8。每個(gè)圖像塊為一個(gè)訓(xùn)練矢量,共 得到含L個(gè)訓(xùn)練矢量的訓(xùn)練矢量集{X(t);t = 0,l,…,L-1}。用隨機(jī)法從訓(xùn)練矢量集中選擇N (N< <L)個(gè)訓(xùn)練矢量來構(gòu)成初始化模式庫(kù){Wj (0); j = 0,1,…,N-1},并將初始模式庫(kù)中的 模式矢量排列成三維立體結(jié)構(gòu)。
[0037]步驟1 · 3)將初始化鄰域設(shè)定為Nj(0),j = 0,1,…,N-1。
[0038] 步驟1.4)輸入一個(gè)訓(xùn)練矢量集中的訓(xùn)練矢量X = (XI,X2,…,xm)t。
[0039] 步驟1.5)選擇均方誤差失真準(zhǔn)則,均方誤差為山(t)=| |X(t)-Wj(t)| I2,分別計(jì)算 該訓(xùn)練矢量與模式庫(kù)中各模式矢量的失真山(t);并選擇具有最小失真的模式矢量為獲勝 模式矢量f。
[0040] 步驟1.6)按下式調(diào)整獲勝模式矢量.f及其三維鄰域A、(t)范圍內(nèi)的模式矢量,
[0042]其中,~⑴為鄰域函數(shù),通常選用單調(diào)遞減函數(shù)
分別為獲勝模式矢量f的最小鄰域和最大鄰域,&為鄰域衰減常數(shù),C2為訓(xùn)練次數(shù)。在 訓(xùn)練的初始階段,鄰域半徑較大,隨著訓(xùn)練次數(shù)的增加,網(wǎng)絡(luò)逐漸趨于穩(wěn)定,只需對(duì)獲勝節(jié) 點(diǎn)進(jìn)行較細(xì)微的權(quán)值調(diào)整,因而鄰域半徑不斷縮小。a(t)為學(xué)習(xí)速度函數(shù),它反映了模式矢 量調(diào)整的幅度大小,一般選用單調(diào)遞減函數(shù)《(〇=4e^,式中Ai為訓(xùn)練開始時(shí)的最大學(xué)習(xí)速 度,Ti為學(xué)習(xí)衰減常數(shù)。
[0043]步驟1.7)返回步驟步驟1.4),直到輸入完訓(xùn)練矢量集中所有的訓(xùn)練矢量,即得到 最佳匹配模式庫(kù)。
[0044] 步驟2)對(duì)待編碼圖像進(jìn)行圖像模式識(shí)別,編碼每個(gè)塊在模式庫(kù)中的匹配模式的索 弓丨。參見圖2。
[0045] 步驟2.1、將待編碼圖像分塊,其中待編碼圖像分塊大小與圖像樣本的分塊大小一 致;
[0046] 步驟2.2、分別計(jì)算每一個(gè)待編碼圖像塊與最佳匹配模式庫(kù)中各模式矢量的失真, 并選擇具有最小失真的模式矢量作為該圖像塊的匹配模式,對(duì)該圖像塊編碼時(shí)只編碼其匹 配模式在模式庫(kù)中的索引;
[0047] 采用均方誤差準(zhǔn)則即下式來計(jì)算待編碼圖像塊與最佳匹配模式庫(kù)中各模式矢量 的失真bW);
[0048] ^(^)=1 |Y(t7 ) I I2
[0049] 其中,Wj (V )為模式矢量,Y(V )為待編碼圖像塊;j = 0,1,…,N-l,N為設(shè)定的三維 自組織映射網(wǎng)絡(luò)的大小;V =0,1,…,K-1,K為待編碼圖像塊的個(gè)數(shù)。
[0050] 步驟2.3、對(duì)待編碼圖像每一個(gè)子圖像塊進(jìn)行步驟2.2的處理,完成了對(duì)圖像的編 碼。
[0051] 具體地,為了說明本方法的性能,做了大量的仿真實(shí)驗(yàn),實(shí)驗(yàn)圖像選擇分辨率為 512父512\81^的標(biāo)準(zhǔn)亮度測(cè)試圖像1^1^、?叩?從 8,用于模式庫(kù)訓(xùn)練和圖像編碼。重建圖 像品質(zhì)的客觀評(píng)價(jià)采用峰值信噪比式中Emse為原始圖像與重建圖像之
,. 間的均方誤差。圖像壓縮比為
式中Μ為模式矢量的維數(shù),Β〇為原始圖像的每像 素比特?cái)?shù),為模式矢量地址比特?cái)?shù)。
[0052]實(shí)驗(yàn)分別用基于指數(shù)鄰域函數(shù)的三維S0M算法和基于本專利新的鄰域函數(shù)的三維 S0M算法設(shè)計(jì)圖像模式識(shí)別模式庫(kù),并通過編碼后重建圖像的質(zhì)量來比較基于這兩種鄰域 函數(shù)的三維S0M算法的性能,其中訓(xùn)練矢量數(shù)為40960,模式庫(kù)大小為1024。表1為選取不同 實(shí)驗(yàn)圖像時(shí),基于指數(shù)鄰域函數(shù)的三維S0M算法和基于本專利新的鄰域函數(shù)的三維S0M算法 用于圖像模式識(shí)別編碼的重建圖像的峰值信噪比(PSNR)。
[0053] 表1重建圖像的PSNR
[0054]
[0055] 由表1可以看出,基于本專利新的鄰域函數(shù)的三維S0M算法的性能比基于指數(shù)鄰域 函數(shù)的三維S0M算法提高了0.0909-0.3013dB。
【主權(quán)項(xiàng)】
1. 基于新的鄰域函數(shù)的三維自組織映射圖像編碼方法,其特征是,包括如下步驟: 步驟1、對(duì)圖像樣本進(jìn)行不斷學(xué)習(xí)訓(xùn)練,得到最佳匹配模式庫(kù); 步驟1.1、對(duì)圖像樣本進(jìn)行分塊,每個(gè)圖像塊為一個(gè)訓(xùn)練矢量,共得到含L個(gè)訓(xùn)練矢量的 訓(xùn)練矢量集; 步驟1.2、從訓(xùn)練矢量集中選擇N個(gè)訓(xùn)練矢量來構(gòu)成初始化模式庫(kù),該初始模式庫(kù)中的 訓(xùn)練矢量稱為模式矢量,且初始模式庫(kù)中的模式矢量排列成三維立體結(jié)構(gòu);上述N< <L; 步驟1.3、設(shè)定鄰域函數(shù)其中,Bo為最小鄰域,B1為最大鄰域,C1為鄰域衰減常數(shù)、C2為訓(xùn)練次數(shù);j = O,1,…,N-I, N為設(shè)定的三維自組織映射網(wǎng)絡(luò)的大小;t = 0,1,…,L-I,L為訓(xùn)練矢量集中訓(xùn)練矢量的個(gè) 數(shù); 步驟1.4、輸入一個(gè)訓(xùn)練矢量,并分別計(jì)算該訓(xùn)練矢量與初始模式庫(kù)中的各個(gè)模式矢量 的失真,從中選擇出與訓(xùn)練矢量失真最小的模式矢量作為獲勝模式矢量; 步驟1.5、調(diào)整獲勝模式矢量及其三維鄰域范圍內(nèi)的模式矢量; 步驟1.6、返回步驟1.4重新選擇一個(gè)訓(xùn)練矢量,直到輸入完所有的訓(xùn)練矢量,得到最佳 匹配模式庫(kù); 步驟2、對(duì)待編碼的圖像進(jìn)行分塊處理,并將這些待編碼圖像塊與最佳匹配模式庫(kù)中的 模式矢量進(jìn)行圖像模式匹配,編碼每個(gè)塊在模式庫(kù)中的匹配模式的索引。2. 根據(jù)權(quán)利要求1所述基于新的鄰域函數(shù)的三維自組織映射圖像編碼方法,其特征是, 步驟1.2中,采用隨機(jī)法從訓(xùn)練矢量集中選擇N個(gè)訓(xùn)練矢量來構(gòu)成初始模式庫(kù)。3. 根據(jù)權(quán)利要求1所述基于新的鄰域函數(shù)的三維自組織映射圖像編碼方法,其特征是, 步驟1.4中,采用下式計(jì)算訓(xùn)練矢量與模式矢量的失真山(t); dj(t)= I |x(t)-ffj(t) 112 其中,Wj(t)為模式矢量,X(t)為訓(xùn)練矢量;j = 0,I,…,N-I,N為設(shè)定的三維自組織映射 網(wǎng)絡(luò)的大小;t = 0,1,…,L_1,L為訓(xùn)練矢量集中訓(xùn)練矢量的個(gè)數(shù)。4. 根據(jù)權(quán)利要求1所述基于新的鄰域函數(shù)的三維自組織映射圖像編碼方法,其特征是, 步驟1 .5中,枏抿下忒調(diào)整莊胖樽忒玍量及其=維郃域茹闈內(nèi)的樽忒玍量共中,WjU+l)73弟t+Ι次訓(xùn)練時(shí)的悮式天重,WjU)為弟t次訓(xùn)練時(shí)的模式矢量,X(t)為 訓(xùn)練矢量,f為獲勝模式矢量,'· W為獲勝模式矢量f在第t次訓(xùn)練時(shí)的鄰域函數(shù),a(t)為 第t次訓(xùn)練時(shí)的學(xué)習(xí)速度函數(shù);j = 0,1,…,N_1,N為設(shè)定的三維自組織映射網(wǎng)絡(luò)的大小;t = O,1,…,L-I,L為訓(xùn)練矢量集中訓(xùn)練矢量的個(gè)數(shù)。5. 根據(jù)權(quán)利要求1所述基于新的鄰域函數(shù)的三維自組織映射圖像編碼方法,其特征是, 步驟2具體為: 步驟2.1、將待編碼的圖像分塊,其中待編碼的圖像分塊大小與圖像樣本的分塊大小相 一致; 步驟2.2、分別計(jì)算每一個(gè)待編碼圖像塊與最佳匹配模式庫(kù)中各模式矢量的失真,并編 碼具有最小失真的模式矢量在模式庫(kù)中的索引; 步驟2.3、對(duì)待編碼的所有圖像進(jìn)行步驟2.2的處理,得到待編碼的圖像的碼流。
【文檔編號(hào)】H04N19/597GK106028043SQ201610316588
【公開日】2016年10月12日
【申請(qǐng)日】2016年5月13日
【發(fā)明人】黎洪松, 程福林
【申請(qǐng)人】桂林電子科技大學(xué)