日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種使用空間稀疏編碼的目標(biāo)識(shí)別與角度粗估計(jì)算法

文檔序號(hào):10687612閱讀:378來(lái)源:國(guó)知局
一種使用空間稀疏編碼的目標(biāo)識(shí)別與角度粗估計(jì)算法
【專利摘要】本發(fā)明提供一種使用空間稀疏編碼的目標(biāo)識(shí)別與角度粗估計(jì)算法,首先取不同目標(biāo)的等間隔角度(15°)的圖像作為訓(xùn)練集,獲取并根據(jù)標(biāo)準(zhǔn)差篩選每個(gè)圖像的空間碎片;繼而對(duì)每幅獨(dú)立的圖像中的碎片,進(jìn)行白化與PCA相結(jié)合的預(yù)處理;然后利用空間碎片分開(kāi)訓(xùn)練每個(gè)目標(biāo)的字典(子字典);去除每個(gè)子字典中無(wú)用的基之后,將子字典整體合并成一個(gè)大字典,使用此大字典重獲訓(xùn)練集圖像碎片的稀疏編碼系數(shù),并統(tǒng)計(jì)每幅圖像內(nèi)的碎片使用大字典中各個(gè)基的次數(shù),以此作為各幅訓(xùn)練圖像的特征向量;最后通過(guò)計(jì)算測(cè)試目標(biāo)圖像在大字典中的基的使用次數(shù)向量(特征向量)與訓(xùn)練集中各幅圖像的特征向量的相關(guān)系數(shù),實(shí)現(xiàn)目標(biāo)分類與角度粗估計(jì)。
【專利說(shuō)明】
一種使用空間稀疏編碼的目標(biāo)識(shí)別與角度粗估計(jì)算法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及一種數(shù)字圖像處理技術(shù),尤其涉及一種使用空間稀疏編碼的目標(biāo)識(shí)別 與角度粗估計(jì)算法。
【背景技術(shù)】
[0002] 人眼在對(duì)物體進(jìn)行識(shí)別分類的時(shí)候存在幾種參量:顏色,形狀,位置,姿態(tài),光照條 件,觀測(cè)點(diǎn),干擾或者噪聲分布等。大數(shù)據(jù)背景下,如何有效的抽象出這些參量已然成為目 標(biāo)識(shí)別分類的首要問(wèn)題,稀疏表達(dá)是當(dāng)前應(yīng)對(duì)這個(gè)問(wèn)題較為有效的方法。
[0003]針對(duì)計(jì)算機(jī)視覺(jué)應(yīng)用領(lǐng)域,傳統(tǒng)方法有DCT,小波等,以上方法旨在利用大量圖像 訓(xùn)練出一個(gè)過(guò)完備字典進(jìn)而對(duì)目標(biāo)圖像進(jìn)行稀疏編碼。其得到的字典是預(yù)先設(shè)定好的,而 手動(dòng)設(shè)定一個(gè)好的字典非常困難,此外其復(fù)雜度和幾何特性在表征不同信號(hào)時(shí)變化很大, 考慮自適應(yīng)得到字典的方法,PCA就是其中一個(gè)代表。PCA方法通過(guò)學(xué)習(xí)的方式,計(jì)算正交的 主方向,通過(guò)將原始信號(hào)表示在以主方向?yàn)榛鶞?zhǔn)的空間上使問(wèn)題得到簡(jiǎn)化。但是PCA對(duì)字典 中的"基"要求較為苛刻,須其嚴(yán)格正交,限制了解決問(wèn)題的靈活性,稀疏表達(dá)由此而來(lái),稀 疏編碼將原始信號(hào)表達(dá)為字典元素的一個(gè)線性組合。
[0004] 針對(duì)目標(biāo)識(shí)別及分類問(wèn)題多使用正交基,或者之間相關(guān)性很小的特征,其目的是 盡可能的減小整個(gè)算法系統(tǒng)的冗余性,因此分類器也多集中于SVM或者淺層神經(jīng)網(wǎng)絡(luò)。多倫 多大學(xué)教授通過(guò)研究深度學(xué)習(xí)網(wǎng)絡(luò),伴隨著硬件處理器性能的飛躍,使得深度學(xué)習(xí)網(wǎng)絡(luò)能 夠突飛猛進(jìn),其中關(guān)鍵技術(shù)就是解決每層神經(jīng)網(wǎng)絡(luò)中的傳遞誤差問(wèn)題。后續(xù)學(xué)者發(fā)現(xiàn)如果 使用完備的特征或者欠完備的特征來(lái)訓(xùn)練網(wǎng)絡(luò),其隱層數(shù)量會(huì)被限制在一個(gè)很小的范圍 內(nèi),同時(shí)準(zhǔn)確率也無(wú)法達(dá)到要求,因此具有過(guò)完備基的稀疏編碼被應(yīng)用于深度學(xué)習(xí)的目標(biāo) 分類中。
[0005] 如上所說(shuō),稀疏編碼在目標(biāo)識(shí)別與分類中多與神經(jīng)網(wǎng)絡(luò)聯(lián)系在一起。兩個(gè)近期文 獻(xiàn)實(shí)現(xiàn)了使用稀疏編碼對(duì)目標(biāo)進(jìn)行分類與人體步態(tài)識(shí)別,都是與神經(jīng)網(wǎng)絡(luò)并行使用的,然 而少有人只通過(guò)過(guò)完備基實(shí)現(xiàn)直接對(duì)目標(biāo)進(jìn)行分類。這樣做的好處是,免去對(duì)深度神經(jīng)網(wǎng) 絡(luò)的訓(xùn)練過(guò)程,節(jié)約大量的運(yùn)算時(shí)間,但是相應(yīng)的需要對(duì)稀疏編碼本身進(jìn)行較大改進(jìn);一種 是針對(duì)過(guò)完備基的改進(jìn),由于基在客觀上的過(guò)完備性,必將存在信息冗余,要使得其較好的 區(qū)分獨(dú)立物體,困難較大;還有一種是由編碼系數(shù)著手,過(guò)完備基其系數(shù)在編碼后會(huì)有較高 的稀疏性,每種物體的系數(shù)稀疏性不同,所對(duì)應(yīng)的稀疏表達(dá)也就不同,因此通過(guò)辨別系數(shù)的 稀疏分布可以達(dá)到分類的目的。

【發(fā)明內(nèi)容】

[0006] 本發(fā)明的目的是為了提供一種使用空間稀疏編碼的目標(biāo)識(shí)別與角度粗估計(jì)算法, 將系數(shù)編碼應(yīng)用于提取目標(biāo)獨(dú)有的具有稀疏性的基,并使用這些獨(dú)有的基構(gòu)成的字典來(lái)稀 疏表示目標(biāo)圖像,進(jìn)而實(shí)現(xiàn)目標(biāo)分類及角度粗估計(jì)。
[0007] 本發(fā)明的目的是這樣實(shí)現(xiàn)的:包括測(cè)試和訓(xùn)練兩個(gè)階段,具體其步驟是:
[0008] (1)訓(xùn)練階段取不同目標(biāo)的等間隔角度的圖像作為訓(xùn)練集,并將訓(xùn)練集中的圖像 十字等分成四個(gè)象限;
[0009] (2)在每個(gè)象限中提取相同數(shù)量標(biāo)準(zhǔn)差最大的圖像碎片:在每個(gè)區(qū)域中選擇1個(gè) 標(biāo)準(zhǔn)差最大的η X η的圖像碎片,每幅圖像選取m個(gè)η X η大小的圖像碎片;
[0010] ⑶對(duì)訓(xùn)練集中每個(gè)目標(biāo)的圖像碎片分別進(jìn)行白化與PCA相結(jié)合的預(yù)處理,得到圖 像碎片數(shù)據(jù)集的矩卩
%每個(gè)圖像碎片預(yù)處理后的數(shù)據(jù)向 量;
[0011] (4)通過(guò)對(duì)預(yù)處理后的碎片稀疏表示訓(xùn)練出屬于每個(gè)目標(biāo)的子字典:
[0012] (5)去除子字典中未用到的基函數(shù),更新子字典;
[0013] (6)將每個(gè)目標(biāo)的子字典合并構(gòu)成一個(gè)大字典;
[0014] (7)利用大字典對(duì)訓(xùn)練圖像碎片進(jìn)行稀疏編碼,同時(shí)獲取訓(xùn)練集圖像的特征向量: 利用得到的大字典對(duì)各訓(xùn)練圖像碎片進(jìn)行稀疏編碼,求解大字典的系數(shù);
[0015] (8)測(cè)試階段首先重復(fù)步驟(1)到步驟(7);
[0016] (9)計(jì)算測(cè)試圖像和訓(xùn)練集中相應(yīng)圖像四個(gè)象限的相關(guān)系數(shù):
[0017] 對(duì)測(cè)試圖像的特征向量與訓(xùn)練圖像的特征向量做相關(guān),一幅圖像有對(duì)應(yīng)四個(gè)象限 的四個(gè)特征向量,分別將這四個(gè)特征向量與訓(xùn)練圖像集中的每幅圖像的四個(gè)特征向量根據(jù)
-對(duì)應(yīng)做相關(guān),得到相關(guān)系數(shù),其中:Xi與Yi分別表 示兩個(gè)待比較向量,X表示向量Xi的均值,F(xiàn)表示向量Yi的均值;
[0018] (10)分別計(jì)算訓(xùn)練集中對(duì)應(yīng)的每幅圖像的相關(guān)系數(shù)均值,確定測(cè)試圖像分類結(jié) 果:取訓(xùn)練集每幅圖像四個(gè)相關(guān)系數(shù)的均值,所有平均相關(guān)系數(shù)中的最大值對(duì)應(yīng)的訓(xùn)練樣 本所屬目標(biāo)種類為測(cè)試圖像分類結(jié)果;
[0019] (11)確定測(cè)試圖像的角度估計(jì)范圍:根據(jù)最大相關(guān)訓(xùn)練圖像的已知角度,結(jié)合訓(xùn) 練圖像集的圖像角度間隔A ang,將測(cè)試圖像的角度估計(jì)為在最大相關(guān)訓(xùn)練圖像對(duì)應(yīng)角度 的左右Aang范圍中。
[0020] 本發(fā)明還包括這樣一些結(jié)構(gòu)特征:
[0021] 1.步驟(3)是依次進(jìn)行PCA降維、白化、與PCA維數(shù)還原,免去對(duì)深度神經(jīng)網(wǎng)絡(luò)的訓(xùn) 練過(guò)程:
[0022] -、采用PCA降維,保留數(shù)據(jù)的主變化方向,具體操作是對(duì)輸入n2Xm維實(shí)矩陣A的 協(xié)方差矩陣A · At進(jìn)行特征分解:
[0023]
[0024] 式中Ai為協(xié)方差矩陣A ·六7的特征值: U1 是心的特征向量,1!2是12的特征向量,以此類推;
[0025]以慣常經(jīng)驗(yàn)法則保留99%的方差,即令ω =99選取滿足以下條件的最小1值,
[0026]
[0027] 得到
[0028] 二、將輸入數(shù)據(jù)矩陣A線性投影至1此上,得到降維后的數(shù)據(jù)A1c^A1ot=U1 tAd
[0029] 然后提取nXn大小的像素碎片,一共有M個(gè)訓(xùn)練碎片,則訓(xùn)練圖像中所有的碎片序 列將被表示為n2 XM維實(shí)矩陣Α,通過(guò)對(duì)輸入數(shù)據(jù)矩陣J e進(jìn)行奇異值分解得到正交矩 陣[/ e 9TW和Γ e ,并得到:
[0030] U 'AV= diug( Crl, · · ·, ) e '.K" xXI , p = min {η2, M \
[0031 ] 其中沉表不實(shí)數(shù)域,〇1多〇2多…^:σρ^:〇;
[0032] 將數(shù)據(jù)A經(jīng)過(guò)線性投影變換為UtA后數(shù)據(jù)各維之間的協(xié)方差變?yōu)榱?,再?jì)算得到各 維數(shù)據(jù)的方差均為1的白化矩陣Α? =CliagdAJ1,…,1/σρ)υτΑ;
[0033] 三、將數(shù)據(jù)還原回到初始的維度η,先使Alm/與矩陣U維數(shù)統(tǒng)一,將第η2-1+1行至η 2 行補(bǔ)零,結(jié)果記為矩陣Aw,由X = U · Aw將數(shù)據(jù)映射回原坐標(biāo)空間,得到最終白化與PCA相結(jié)合 的預(yù)處理后的矩陣X:
[0034]
[0035] 式中:為每個(gè)圖像碎片預(yù)處理后的數(shù)據(jù)向量,貨表示實(shí)數(shù)域。
[0036] 2.步驟(4)具體是:
[0037] 已知目標(biāo)函數(shù)J:
[0038]
[0039] 式中:m為每種目標(biāo)訓(xùn)練集中所有圖像提取的碎片數(shù),X1為第i個(gè)圖象碎片預(yù)處理 后數(shù)據(jù)向量,k為字典所包含的basis的個(gè)數(shù),為當(dāng)表示第i個(gè)圖像碎片時(shí)字典中第j個(gè)基 的系數(shù),A為字典中第j個(gè)基,第一項(xiàng)
3m個(gè)圖像碎片的重建誤差,表征編碼 描述圖像的效果,第二項(xiàng)為系數(shù)的稀疏懲罰項(xiàng);采用梯度下降法使目標(biāo)函數(shù)J的最小化,每 個(gè)圖像碎片可通過(guò)完備的基與系數(shù)線性稀疏表示,在訓(xùn)練字典的過(guò)程中,使用梯度下降法 對(duì)系數(shù)和基函數(shù)輪流更新,從而得到編碼字典Φ = ^,…,約丨》
[0040] 3.步驟(5)包括:首先為每一個(gè)圖像碎片的編碼系數(shù)以α為比例設(shè)置元素閾值 α · a i m a χ,a i m a χ表示第i個(gè)圖像碎片中稀疏編碼后最大的系數(shù)根據(jù)式
(寸稀疏編碼系數(shù)進(jìn)行軟稀疏,將數(shù)值較小的系數(shù)置零,相當(dāng)于將 稀疏表示時(shí)作用很小的成分去除,最后基于軟稀疏后的系數(shù)檢查字典中基的使用情況,去 除那些系數(shù)為零的基,更新子字典。
[0041]與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:本發(fā)明提供了一種使用空間稀疏編碼的 目標(biāo)識(shí)別與角度粗估計(jì)算法,增加圖像碎片的空間選取方式,并使用PCA與白化相結(jié)合的預(yù) 處理算法增加識(shí)別準(zhǔn)確率。最終利用系數(shù)的稀疏性,使用大字典的系數(shù)分布來(lái)實(shí)現(xiàn)分類與 角度粗估計(jì)。傳統(tǒng)方法以神經(jīng)網(wǎng)絡(luò)與稀疏編碼相結(jié)合的方式實(shí)現(xiàn)目標(biāo)分類,本發(fā)明直接使 用稀疏編碼對(duì)目標(biāo)進(jìn)行分類,跳過(guò)深度神經(jīng)網(wǎng)絡(luò)部分,免去了對(duì)深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程, 節(jié)約了大量的運(yùn)算時(shí)間。此外本算法實(shí)現(xiàn)了目標(biāo)不同角度的粗略估計(jì),這在以往的研究中 極少出現(xiàn)。
【附圖說(shuō)明】
[0042]圖1為本發(fā)明的算法流程圖;
[0043] 圖2為本發(fā)明的空間碎片提取圖像;
[0044] 圖3為本發(fā)明的輸入灰度圖像;
[0045] 圖4為本發(fā)明的灰度圖像全部碎片;
[0046] 圖5為本發(fā)明的提取灰度圖像部分碎片;
[0047]圖6為本發(fā)明的圖像碎片預(yù)處理結(jié)果;
[0048]圖7為本發(fā)明的子字典系數(shù);
[0049] 圖8為本發(fā)明的更新子字典系數(shù);
[0050] 圖9為本發(fā)明的大字典生成過(guò)程;
[0051] 圖10為本發(fā)明的大字典生成結(jié)果;
[0052] 圖11為本發(fā)明的實(shí)驗(yàn)結(jié)果表。
【具體實(shí)施方式】
[0053]下面結(jié)合附圖與【具體實(shí)施方式】對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
[0054]本發(fā)明旨在以稀疏編碼的方式來(lái)對(duì)目標(biāo)進(jìn)行特征學(xué)習(xí),進(jìn)而對(duì)目標(biāo)進(jìn)行分類識(shí) 另IJ,同時(shí)對(duì)圖像所對(duì)應(yīng)的目標(biāo)角度進(jìn)行粗略的估計(jì)。算法首先取不同目標(biāo)的等間隔角度 (15°)的圖像作為訓(xùn)練集,獲取并根據(jù)標(biāo)準(zhǔn)差篩選每個(gè)圖像的空間碎片;繼而對(duì)每幅獨(dú)立的 圖像中的碎片,進(jìn)行白化與PCA相結(jié)合的預(yù)處理;然后利用空間碎片分開(kāi)訓(xùn)練每個(gè)目標(biāo)的字 典(子字典);去除每個(gè)子字典中無(wú)用的基之后,將子字典整體合并成一個(gè)大字典,使用此大 字典重獲訓(xùn)練集圖像碎片的稀疏編碼系數(shù),并統(tǒng)計(jì)每幅圖像內(nèi)的碎片使用大字典中各個(gè)基 的次數(shù),以此作為各幅訓(xùn)練圖像的特征向量;最后通過(guò)計(jì)算測(cè)試目標(biāo)圖像在大字典中的基 的使用次數(shù)向量(特征向量)與訓(xùn)練集中各幅圖像的特征向量的相關(guān)系數(shù),實(shí)現(xiàn)目標(biāo)分類與 角度粗估計(jì)。
[0055] 結(jié)合圖1,本發(fā)明包括分為測(cè)試和訓(xùn)練兩個(gè)階段,具體步驟如下:
[0056] (1)訓(xùn)練階段將訓(xùn)練集中的圖像十字等分成四個(gè)區(qū)域(象限)
[0057] 首先取不同目標(biāo)的等間隔角度(15°)的圖像作為訓(xùn)練集,將訓(xùn)練集中的圖像分別 十字等分成四個(gè)區(qū)域(象限)。
[0058] (2)在每個(gè)象限中提取相同數(shù)量標(biāo)準(zhǔn)差最大的圖像碎片 m
[0059] 在每個(gè)區(qū)域中選擇j個(gè)標(biāo)準(zhǔn)差最大的η X η的圖像碎片,每幅圖像選取m個(gè)η X η大 小的圖像碎片。其中空間碎片提取過(guò)程(圖2所示),輸入灰度圖像(圖3所示),灰度圖像全部 碎片(圖4所示),提取的灰度圖像部分碎片(圖5所示)。
[0060] (3)對(duì)訓(xùn)練集中每個(gè)目標(biāo)的圖像碎片分別進(jìn)行白化與PCA相結(jié)合的預(yù)處理
[0061] 首先采用PCA(principal components analysis)降維,保留數(shù)據(jù)的主變化方向, 具體操作是對(duì)輸入n2Xm維實(shí)矩陣A的協(xié)方差矩陣A ·六7進(jìn)行特征分解,
[0062]
[0063] 其中Ai為協(xié)方差矩陣A · At的特征值, 是心的特征向量,1!2是12的特征向量,以此類推。
[0064] 以慣常經(jīng)驗(yàn)法則保留99%的方差,即令ω =99選取滿足以下條件的最小1值,
[0065]
[0066] 得到?7/6識(shí)~;
[0067]再將輸入數(shù)據(jù)矩陣A線性投影到也上,得到降維后的數(shù)據(jù)A1qw,A1qw=U 1tAd
[0068]然后提取ηΧη大小的像素碎片,一共有M個(gè)訓(xùn)練碎片,則訓(xùn)練圖像中所有的碎片序 列將被表示為n2 XM維實(shí)矩陣Α。通過(guò)對(duì)輸入數(shù)據(jù)矩陣J e況"2^進(jìn)行奇異值分解得到正交矩
[0070] 其中91表不實(shí)數(shù)域,〇1多〇2多…^σρ^:〇。
[0071] 將數(shù)據(jù)A經(jīng)過(guò)線性投影變換為UtA后數(shù)據(jù)各維之間的協(xié)方差變?yōu)榱?,即消除了各維 數(shù)據(jù)之間的相關(guān)性。再計(jì)算得到各維數(shù)據(jù)的方差均為1的白化矩陣Y=diag(l/ 〇1,…, l/〇p)UTA〇
[0072] 最后將數(shù)據(jù)還原回到初始的維度η,先使Alm/與矩陣U維數(shù)統(tǒng)一,將第η2_1+1行至η 2 行補(bǔ)零,結(jié)果記為矩陣Aw。由X = U · Aw將數(shù)據(jù)映射回原坐標(biāo)空間,得到最終白化與PCA相結(jié)合 的預(yù)處理后的矩f
,其中\(zhòng) 為每個(gè)圖像碎片預(yù)處理后的數(shù)據(jù)向 量。圖像碎片預(yù)處理結(jié)果(圖7所示)。
[0073] (4)通過(guò)對(duì)預(yù)處理后的碎片稀疏表示訓(xùn)練出屬于每個(gè)目標(biāo)的子字典
[0074]預(yù)處理后的圖像碎片數(shù)據(jù)集為
,我們通過(guò)采用梯度下降法作 為最優(yōu)化算法求解目標(biāo)函I
I的最小值,得到編碼字典 Φ =丨仍,…,% }。其中,m為每種目標(biāo)訓(xùn)練集中所有圖像提取的碎片數(shù),X1為第i個(gè)碎片預(yù)處理 后數(shù)據(jù)向量,k為字典所包含的basis的個(gè)數(shù),為當(dāng)表示第i個(gè)碎片時(shí)字典中第j個(gè)基的系 數(shù),朽為字典中第j個(gè)基。第-
3m個(gè)碎片的重建誤差,表征編碼描述圖像 的效果。第二項(xiàng)為系數(shù)的稀疏懲罰項(xiàng)。參考有關(guān)文獻(xiàn),選擇
作為本算 法的稀疏懲罰函數(shù),其中σ為系數(shù)的權(quán)重,λ為懲罰系數(shù),是一個(gè)正的常數(shù)。可知當(dāng)系數(shù)a1;j越 大時(shí),稀疏懲罰函數(shù)值越大,目標(biāo)函I
的值越大。當(dāng)系 數(shù)值為零時(shí)不會(huì)有懲罰,懲罰項(xiàng)的值為零。因此稀疏懲罰項(xiàng)約束了系數(shù)向量,使其中的 非零元素及數(shù)值較大的元素盡可能的少。
[0075] 當(dāng)采用梯度下降法使目標(biāo)函數(shù):
1小化后,每 個(gè)圖像碎片就可以通過(guò)完備的基與系數(shù)線性稀疏表示。在訓(xùn)練字典的過(guò)程中,使用梯度下 降法對(duì)系數(shù)和基函數(shù)輪流更新。首先固定基函數(shù),采用梯度下降法更新一次系數(shù),再固定系 數(shù),更新一次基函數(shù),使目標(biāo)函數(shù)值逐漸向最小值逼近。每完成一次更新計(jì)算一次目標(biāo)函數(shù) 值J。梯度下降法需要調(diào)整步長(zhǎng)使達(dá)到收斂的時(shí)間得以縮短。根據(jù)梯度下降法使用
分別以更新系數(shù)時(shí)步長(zhǎng)speed與更新基函數(shù)時(shí) 步長(zhǎng)eta的速度更新系數(shù)和基朽。由于初始字典中基的個(gè)數(shù)人為設(shè)定,設(shè)置個(gè)數(shù)適當(dāng)多 一些用以保證字典的冗余性和超完備性。
[0076] (5)去除子字典中未用到的基函數(shù)更新子字典
[0077] 在字典訓(xùn)練初步完成之后,我們同時(shí)得到了一系列系數(shù)向量,每個(gè)系數(shù)向量對(duì)應(yīng) 一個(gè)圖像碎片。每個(gè)系數(shù)向量中總會(huì)有一些元素值與其他元素相比很小,也就意味著那些 系數(shù)對(duì)應(yīng)的基在表示這幅圖像碎片時(shí)所起的作用很小,因此我們可以去掉這些成分而不會(huì) 影響稀疏表示圖像碎片時(shí)的重建效果。我們將其稱為軟系數(shù)閾值。具體操作首先為每一個(gè) 圖像碎片的編碼系數(shù)ai, j以α為比例設(shè)置元素閾值α · aimax,aimax表示第i個(gè)圖像碎片中稀疏 編碼后最大的系數(shù)。相當(dāng)于每次閾值都與當(dāng)前圖像碎片的編碼稀疏的最大值相關(guān),根據(jù)式:
:寸稀疏編碼系數(shù)進(jìn)行軟稀疏。將數(shù)值較小的系數(shù)置零,相當(dāng)于將稀 疏表示時(shí)作用很小的成分去除。最后基于軟稀疏后的系數(shù)檢查字典中基的使用情況,去除 那些系數(shù)為零的基。更新前聯(lián)合大字典系數(shù)(圖7所示),軟稀疏更新后聯(lián)合大字典系數(shù)(圖8 所示)。
[0078] (6)將每個(gè)目標(biāo)的子字典合并構(gòu)成一個(gè)大字典
[0079] 在每個(gè)目標(biāo)子字典訓(xùn)練完成之后,我們將所有目標(biāo)的子字典合并為一個(gè)大字典。 大字典合并過(guò)程(圖9所示),大字典合并結(jié)果(圖10所示)。
[0080] (7)利用大字典對(duì)訓(xùn)練圖像碎片進(jìn)行稀疏編碼,同時(shí)獲取訓(xùn)練集圖像的特征向量
[0081] 利用得到的大字典對(duì)各訓(xùn)練圖像碎片進(jìn)行稀疏編碼,求解大字典的系數(shù),此時(shí)的 大字典已經(jīng)固定,只需采用梯度下降法求解系數(shù),用于目標(biāo)分類與角度粗估計(jì)(圖9所示), 也即利用系數(shù)的稀疏性,使用大字典的系數(shù)分布來(lái)實(shí)現(xiàn)分類與角度粗估計(jì)。
[0082] (8)測(cè)試階段首先重復(fù)步驟(1)到步驟(7)處理
[0083] (9)計(jì)算測(cè)試圖像和訓(xùn)練集中相應(yīng)圖像四個(gè)象限的相關(guān)系數(shù)
[0084] 對(duì)測(cè)試圖像的特征向量與訓(xùn)練圖像的特征向量做相關(guān),一幅圖像有對(duì)應(yīng)四個(gè)象限 的四個(gè)特征向量,分別將這四個(gè)特征向量與訓(xùn)練圖像集中的每幅圖像的四個(gè)特征向量根據(jù)
-一對(duì)應(yīng)地做相關(guān),Xi與Yi分別表示兩個(gè)待比較向量, .Z表示向量Xi的均值,F(xiàn)表示向量Yi的均值。
[0085] (10)分別計(jì)算訓(xùn)練集中對(duì)應(yīng)的每幅圖像的相關(guān)系數(shù)均值,確定測(cè)試圖像分類結(jié)果
[0086] 取訓(xùn)練集每幅圖像四個(gè)相關(guān)系數(shù)的均值,所有平均相關(guān)系數(shù)中的最大值對(duì)應(yīng)的訓(xùn) 練樣本所屬目標(biāo)種類為測(cè)試圖像分類結(jié)果。
[0087] (11)確定測(cè)試圖像的角度估計(jì)范圍
[0088]由上一步得到最大相關(guān)訓(xùn)練圖像,根據(jù)最大相關(guān)訓(xùn)練圖像的已知角度,結(jié)合訓(xùn)練 圖像集的圖像角度間隔A ang,將測(cè)試圖像的角度估計(jì)為在最大相關(guān)訓(xùn)練圖像對(duì)應(yīng)角度的 左右Δ ang范圍中,即角度分辨率相當(dāng)于Δ ang。本算法目標(biāo)分類及角度粗估計(jì)結(jié)果(圖11所 示)。
【主權(quán)項(xiàng)】
1. 一種使用空間稀疏編碼的目標(biāo)識(shí)別與角度粗估計(jì)算法,其特征在于:包括測(cè)試和訓(xùn) 練兩個(gè)階段,具體其步驟是: (1) 訓(xùn)練階段取不同目標(biāo)的等間隔角度的圖像作為訓(xùn)練集,并將訓(xùn)練集中的圖像十字 等分成四個(gè)象限; (2) 在每個(gè)象限中提取相同數(shù)量標(biāo)準(zhǔn)差最大的圖像碎片:在每個(gè)區(qū)域中選擇個(gè)標(biāo)準(zhǔn) 差最大的ηΧη的圖像碎片,每幅圖像選取m個(gè)η X η大小的圖像碎片;(3) 對(duì)訓(xùn)練集中每個(gè)目標(biāo)的圖像碎片分別進(jìn)行白化與PCA相結(jié)合的預(yù)處理,得到圖像碎 片數(shù)據(jù)集的矩陣X = C.V…,a· J e W:xw ,.卩e為每個(gè)圖像碎片預(yù)處理后的數(shù)據(jù)向量; (4) 通過(guò)對(duì)預(yù)處理后的碎片稀疏表示訓(xùn)練出屬于每個(gè)目標(biāo)的子字典: (5) 去除子字典中未用到的基函數(shù),更新子字典; (6) 將每個(gè)目標(biāo)的子字典合并構(gòu)成一個(gè)大字典; (7) 利用大字典對(duì)訓(xùn)練圖像碎片進(jìn)行稀疏編碼,同時(shí)獲取訓(xùn)練集圖像的特征向量:利用 得到的大字典對(duì)各訓(xùn)練圖像碎片進(jìn)行稀疏編碼,求解大字典的系數(shù); (8) 測(cè)試階段首先重復(fù)步驟(1)到步驟(7); (9) 計(jì)算測(cè)試圖像和訓(xùn)練集中相應(yīng)圖像四個(gè)象限的相關(guān)系數(shù): 對(duì)測(cè)試圖像的特征向量與訓(xùn)練圖像的特征向量做相關(guān),一幅圖像有對(duì)應(yīng)四個(gè)象限的四 個(gè)特征向量,分別將這四個(gè)特征向量與訓(xùn)練圖像集中的每幅圖像的四個(gè)特征向量根據(jù)公式一一對(duì)應(yīng)做相關(guān),得到相關(guān)系數(shù),其中:11與¥ 1分別表示兩 個(gè)待比較向量,叉表示向量&的均值,F(xiàn)表示向量1的均值; (10) 分別計(jì)算訓(xùn)練集中對(duì)應(yīng)的每幅圖像的相關(guān)系數(shù)均值,確定測(cè)試圖像分類結(jié)果:取 訓(xùn)練集每幅圖像四個(gè)相關(guān)系數(shù)的均值,所有平均相關(guān)系數(shù)中的最大值對(duì)應(yīng)的訓(xùn)練樣本所屬 目標(biāo)種類為測(cè)試圖像分類結(jié)果; (11) 確定測(cè)試圖像的角度估計(jì)范圍:根據(jù)最大相關(guān)訓(xùn)練圖像的已知角度,結(jié)合訓(xùn)練圖 像集的圖像角度間隔A ang,將測(cè)試圖像的角度估計(jì)為在最大相關(guān)訓(xùn)練圖像對(duì)應(yīng)角度的左 右Aang范圍中。2. 根據(jù)權(quán)利要求1所述的一種使用空間稀疏編碼的目標(biāo)識(shí)別與角度粗估計(jì)算法,其特 征在于:步驟(3)是依次進(jìn)行PCA降維、白化、與PCA維數(shù)還原,免去對(duì)深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò) 程: 一、采用PCA降維,保留數(shù)據(jù)的主變化方向,具體操作是對(duì)輸入n2Xm維實(shí)矩陣A的協(xié)方差 矩陣A · Ατ進(jìn)行特征分解:式中Xi為協(xié)方差矩陣Α·ΑΤ的特征值,之,," = [*1,"2,. '2:],ui是入工的 特征向量,U2是λ2的特征向量,以此類推; 以慣常經(jīng)驗(yàn)法則保留99%的方差,即令ω =99選取滿足以下條件的最小1值, 得到ReW';二、 將輸入數(shù)據(jù)矩陣A線性投影至IM上,得到降維后的數(shù)據(jù)A^Mc^UjA。 然后提取ηΧη大小的像素碎片,一共有Μ個(gè)訓(xùn)練碎片,則訓(xùn)練圖像中所有的碎片序列將 被表示為η2ΧΜ維實(shí)矩陣Α,通過(guò)對(duì)輸入數(shù)據(jù)矩陣」£^\?進(jìn)行奇異值分解得到正交矩陣 V e 識(shí)"、2和F e 9?Λ/χΛ/,并得到: U1 AV = diag{ar· · ,σ ρ) (Ξ^Ι"χ,? ,p=min{n2,M} 其中.?表不實(shí)數(shù)域,〇1多〇2多…^:σρ^:〇; 將數(shù)據(jù)Α經(jīng)過(guò)線性投影變換為UTA后數(shù)據(jù)各維之間的協(xié)方差變?yōu)榱?,再?jì)算得到各維數(shù) 據(jù)的方差均為1的白化矩陣A',A'zdiaga/oi,…,l/op)UTA; 三、 將數(shù)據(jù)還原回到初始的維度η,先使AlOT '與矩陣U維數(shù)統(tǒng)一,將第η2-1+1行至η2行補(bǔ) 零,結(jié)果記為矩陣心,由X = U · Aw將數(shù)據(jù)映射回原坐標(biāo)空間,得到最終白化與PCA相結(jié)合的預(yù) 處理后的矩陣X:式中:X e 為每個(gè)圖像碎片預(yù)處理后的數(shù)據(jù)向量,9?表示實(shí)數(shù)域。3. 根據(jù)權(quán)利要求1或2所述的一種使用空間稀疏編碼的目標(biāo)識(shí)別與角度粗估計(jì)算法,其 特征在于:步驟(4)具體是: 已知目標(biāo)函數(shù)J:式中:m為每種目標(biāo)訓(xùn)練集中所有圖像提取的碎片數(shù),Xl為第i個(gè)圖象碎片預(yù)處理后數(shù)據(jù) 向量,k為字典所包含的basis的個(gè)數(shù),ai,j為當(dāng)表示第i個(gè)圖像碎片時(shí)字典中第j個(gè)基的系 數(shù),A為字典中第j個(gè)基,第一項(xiàng)圖像碎片的重建誤差,表征編碼描 述圖像的效果,第二項(xiàng)為系數(shù)的稀疏懲罰項(xiàng);采用梯度下降法使目標(biāo)函數(shù)J的最小化,每個(gè) 圖像碎片可通過(guò)完備的基與系數(shù)線性稀疏表示,在訓(xùn)練字典的過(guò)程中,使用梯度下降法對(duì) 系數(shù)和基函數(shù)輪流更新,從而得到編碼字典? = (?,…,魏}。4. 根據(jù)權(quán)利要求1或2所述的一種使用空間稀疏編碼的目標(biāo)識(shí)別與角度粗估計(jì)算法,其 特征在于:步驟(5)包括:首先為每一個(gè)圖像碎片的編碼系數(shù)以α為比例設(shè)置元素閾值 α · a i m a x,a i m a χ表示第i個(gè)圖像碎片中稀疏編碼后最大的系數(shù)根據(jù)式對(duì)稀疏編碼系數(shù)進(jìn)行軟稀疏,將數(shù)值較小的系數(shù)置零,相當(dāng)于將 稀疏表示時(shí)作用很小的成分去除,最后基于軟稀疏后的系數(shù)檢查字典中基的使用情況,去 除那些系數(shù)為零的基,更新子字典。5.根據(jù)權(quán)利要求3所述的一種使用空間稀疏編碼的目標(biāo)識(shí)別與角度粗估計(jì)算法,其特 征在于:步驟(5)包括:首先為每一個(gè)圖像碎片的編碼系數(shù)以α為比例設(shè)置元素閾值α · aimax,aimax表示第i個(gè)圖像碎片中稀疏編碼后最大的系數(shù)根據(jù)式稀疏編碼系數(shù)進(jìn)行軟稀疏,將數(shù)值較小的系數(shù)置零,相當(dāng)于將稀疏表示時(shí)作用很小的成分 去除,最后基于軟稀疏后的系數(shù)檢查字典中基的使用情況,去除那些系數(shù)為零的基,更新子 字典。
【文檔編號(hào)】G06N3/02GK106056141SQ201610363559
【公開(kāi)日】2016年10月26日
【申請(qǐng)日】2016年5月27日
【發(fā)明人】卞紅雨, 陳奕名, 金月, 柳旭
【申請(qǐng)人】哈爾濱工程大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1