視頻流人臉檢測(cè)方法及其裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻處理領(lǐng)域,特別涉及視頻流人臉檢測(cè)技術(shù)。
【背景技術(shù)】
[0002]人臉檢測(cè)是計(jì)算機(jī)視覺和模式識(shí)別中的一項(xiàng)基本研宄內(nèi)容,它是人臉識(shí)別的前提,在人機(jī)交互、視頻檢索和智能監(jiān)控等領(lǐng)域中有著廣泛的應(yīng)用。人臉檢測(cè)的目的是在圖像或者視頻流中找到人臉?biāo)诘奈恢眉捌浯笮?。目前人臉檢測(cè)最常用的方法是保羅?維奧拉(Paul V1la)和邁克爾?瓊斯(Michael Jones)等人提出的AdaBoost (—種迭代算法)算法,該算法具有檢測(cè)精度高、檢測(cè)速度快的優(yōu)點(diǎn)。
[0003]AdaBoost算法使用類Haar特征組成級(jí)聯(lián)分類器,該級(jí)聯(lián)分類器是通過訓(xùn)練得到。在進(jìn)行人臉檢測(cè)時(shí),為了檢測(cè)到不同大小的人臉,原圖像按照一系列的比例系數(shù)縮放為待檢測(cè)圖像集合,該圖像集合被稱為圖像金字塔。然后圖像金字塔中的圖像按照一定的步長(zhǎng)被分為nXn大小的檢測(cè)窗口,η的經(jīng)驗(yàn)值是24。之后使用級(jí)聯(lián)分類器對(duì)這些窗口進(jìn)行檢測(cè),如果檢測(cè)窗口通過了全部級(jí)聯(lián)分類器的檢測(cè),那么該檢測(cè)窗口所含的圖像中就被認(rèn)為含有人臉。
[0004]傳統(tǒng)的AdaBoost算法在計(jì)算中存在較多的冗余計(jì)算,對(duì)每個(gè)縮放尺度的所有窗口進(jìn)行檢測(cè)需要消耗大量的計(jì)算資源和時(shí)間,尤其對(duì)于視頻流。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于提供一種視頻流人臉檢測(cè)方法及其裝置,可根據(jù)統(tǒng)計(jì)值減小圖像縮放尺度范圍或檢測(cè)窗口尺寸變化范圍,降低圖像檢測(cè)計(jì)算量,提高人臉檢測(cè)速度,節(jié)省系統(tǒng)的計(jì)算資源。
[0006]為解決上述技術(shù)問題,本發(fā)明的實(shí)施方式公開了一種視頻流人臉檢測(cè)方法,包括以下步驟:
[0007]獲取當(dāng)前幀圖像;
[0008]根據(jù)前一幀圖像的縮放圖像的第一人臉窗口概率值確定當(dāng)前幀圖像進(jìn)行縮放處理時(shí)需要的縮放尺度范圍,并在縮放尺度范圍內(nèi)對(duì)當(dāng)前幀圖像進(jìn)行縮放處理,生成該當(dāng)前幀圖像的圖像金字塔;
[0009]生成圖像金字塔中每張縮放圖像的檢測(cè)窗口 ;
[0010]判斷生成的檢測(cè)窗口是否含有人臉,并統(tǒng)計(jì)每張縮放圖像含有人臉的檢測(cè)窗口的數(shù)目和不含人臉的檢測(cè)窗口的數(shù)目,得到當(dāng)前幀的每張縮放圖像的第一人臉窗口概率值,以供下一幀圖像進(jìn)行縮放處理時(shí)使用,其中,第一人臉窗口概率值中的最大值越大,下一幀圖像的縮放尺度范圍越小,且第一人臉窗口概率值越大,下一幀圖像的縮放尺度范圍的中心值越靠近與該第一人臉窗口概率值對(duì)應(yīng)的縮放圖像的縮放尺度。
[0011]本發(fā)明的實(shí)施方式還公開了一種視頻流人臉檢測(cè)方法,包括以下步驟:
[0012]獲取當(dāng)前幀圖像;
[0013]根據(jù)前一幀圖像的第二人臉窗口概率值確定當(dāng)前幀圖像的檢測(cè)窗口尺寸范圍,并在該尺寸范圍內(nèi)生成當(dāng)前幀圖像的不同尺寸的檢測(cè)窗口;
[0014]判斷生成的檢測(cè)窗口是否含有人臉,并統(tǒng)計(jì)每個(gè)檢測(cè)窗口尺寸下具有人臉的檢測(cè)窗口的數(shù)目,得到當(dāng)前幀的每個(gè)檢測(cè)窗口尺寸的第二人臉窗口概率值,供下一幀圖像生成檢測(cè)窗口時(shí)使用,其中,第二人臉窗口概率值中的最大值越大,下一幀圖像的檢測(cè)窗口尺寸范圍越小,且第二人臉窗口概率值越大,下一幀圖像的檢測(cè)窗口尺寸范圍的中心值越靠近該第二人臉窗口概率值對(duì)應(yīng)的檢測(cè)窗口尺寸。
[0015]本發(fā)明的實(shí)施方式還公開了一種視頻流人臉檢測(cè)裝置,包括:
[0016]第一獲取單元,用于獲取當(dāng)前幀圖像;
[0017]圖像縮放單元,用于根據(jù)前一幀圖像的縮放圖像的第一人臉窗口概率值確定當(dāng)前幀圖像進(jìn)行縮放處理時(shí)需要的縮放尺度范圍,并在縮放尺度范圍內(nèi)對(duì)當(dāng)前幀圖像進(jìn)行縮放處理,生成該當(dāng)前幀圖像的圖像金字塔;
[0018]第一生成單元,用于生成圖像金字塔中每張縮放圖像的檢測(cè)窗口 ;
[0019]第一判斷單元,用于判斷所述第一生成單元生成的檢測(cè)窗口是否含有人臉;
[0020]第一統(tǒng)計(jì)單元,用于統(tǒng)計(jì)第一判斷單元判斷出的每張縮放圖像含有人臉的檢測(cè)窗口的數(shù)目和不含人臉的檢測(cè)窗口的數(shù)目,得到當(dāng)前幀的每張縮放圖像的第一人臉窗口概率值,以供下一幀圖像進(jìn)行縮放處理時(shí)使用,其中,第一人臉窗口概率值中的最大值越大,下一幀圖像的縮放尺度范圍越小,且第一人臉窗口概率值越大,下一幀圖像的縮放尺度范圍的中心值越靠近與該第一人臉窗口概率值對(duì)應(yīng)的縮放圖像的縮放尺度。
[0021]本發(fā)明的實(shí)施方式還公開了一種視頻流人臉檢測(cè)裝置,包括:
[0022]第二獲取單元,用于獲取當(dāng)前幀圖像;
[0023]第二生成單元,用于根據(jù)前一幀圖像的第二人臉窗口概率值確定當(dāng)前幀圖像的檢測(cè)窗口尺寸范圍,并在該尺寸范圍內(nèi)生成當(dāng)前幀圖像的不同尺寸的檢測(cè)窗口 ;
[0024]第二判斷單元,用于判斷所述第二生成單元生成的檢測(cè)窗口是否含有人臉;
[0025]第二統(tǒng)計(jì)單元,用于統(tǒng)計(jì)每個(gè)檢測(cè)窗口尺寸下具有人臉的檢測(cè)窗口的數(shù)目,得到當(dāng)前幀的每個(gè)檢測(cè)窗口尺寸的第二人臉窗口概率值,供下一幀圖像生成檢測(cè)窗口時(shí)使用,其中,第二人臉窗口概率值中的最大值越大,下一幀圖像的檢測(cè)窗口尺寸范圍越小,且第二人臉窗口概率值越大,下一幀圖像的檢測(cè)窗口尺寸范圍的中心值越靠近該第二人臉窗口概率值對(duì)應(yīng)的檢測(cè)窗口尺寸。
[0026]本發(fā)明實(shí)施方式與現(xiàn)有技術(shù)相比,主要區(qū)別及其效果在于:
[0027]通過對(duì)是否含有人臉的檢測(cè)窗口的數(shù)目進(jìn)行統(tǒng)計(jì),可根據(jù)統(tǒng)計(jì)值減小圖像縮放尺度范圍,降低圖像檢測(cè)計(jì)算量,提高人臉檢測(cè)速度,節(jié)省系統(tǒng)的計(jì)算資源。
[0028]通過對(duì)是否含有人臉的檢測(cè)窗口的尺寸和對(duì)應(yīng)的數(shù)目進(jìn)行統(tǒng)計(jì),可根據(jù)統(tǒng)計(jì)值減小檢測(cè)窗口尺寸范圍,減少檢測(cè)窗口數(shù)目,降低圖像檢測(cè)計(jì)算量,提高人臉檢測(cè)速度,節(jié)省系統(tǒng)的計(jì)算資源。
【附圖說明】
[0029]圖1是本發(fā)明第一實(shí)施方式中一種視頻流人臉檢測(cè)方法的流程示意圖;
[0030]圖2是現(xiàn)有技術(shù)中圖像金字塔的示意圖;
[0031]圖3是本發(fā)明第一實(shí)施方式中級(jí)聯(lián)分類器的工作示意圖;
[0032]圖4是本發(fā)明第一實(shí)施方式中一類Haar特征例子的示意圖;
[0033]圖5是本發(fā)明的第一實(shí)施方式中圖像積分圖計(jì)算示意圖;
[0034]圖6是本發(fā)明第二實(shí)施方式中一種視頻流人臉檢測(cè)方法的流程示意圖;
[0035]圖7是本發(fā)明第三實(shí)施方式中檢測(cè)的窗口數(shù)目、節(jié)省的冗余計(jì)算量與s的關(guān)系圖;
[0036]圖8是本發(fā)明第四實(shí)施方式中一種視頻流人臉檢測(cè)裝置的結(jié)構(gòu)示意圖;
[0037]圖9是本發(fā)明第五實(shí)施方式中一種視頻流人臉檢測(cè)裝置的結(jié)構(gòu)示意圖;
[0038]圖10是本發(fā)明第六實(shí)施方式中一種視頻流人臉檢測(cè)裝置的結(jié)構(gòu)示意圖;
[0039]圖11是本發(fā)明第六實(shí)施方式中圖像縮放尺度范圍示意圖。
【具體實(shí)施方式】
[0040]在以下的敘述中,為了使讀者更好地理解本申請(qǐng)而提出了許多技術(shù)細(xì)節(jié)。但是,本領(lǐng)域的普通技術(shù)人員可以理解,即使沒有這些技術(shù)細(xì)節(jié)和基于以下各實(shí)施方式的種種變化和修改,也可以實(shí)現(xiàn)本申請(qǐng)各權(quán)利要求所要求保護(hù)的技術(shù)方案。
[0041]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明的實(shí)施方式作進(jìn)一步地詳細(xì)描述。
[0042]本發(fā)明第一實(shí)施方式涉及一種視頻流人臉檢測(cè)方法。圖1是該視頻流人臉檢測(cè)方法的流程示意圖。
[0043]具體地,如圖1所示,該視頻流人臉檢測(cè)方法包括以下步驟:
[0044]在步驟101中,獲取當(dāng)前幀圖像。
[0045]此后進(jìn)入步驟102,根據(jù)前一幀圖像的縮放圖像的第一人臉窗口概率值確定當(dāng)前幀圖像進(jìn)行縮放處理時(shí)需要的縮放尺度范圍,并在縮放尺度范圍內(nèi)對(duì)當(dāng)前幀圖像進(jìn)行縮放處理,生成該當(dāng)前幀圖像的圖像金字塔。
[0046]其中,圖像金字塔是一系列以金字塔形狀排列的且靠近金字塔頂端分辨率逐步降低的圖像集合,其示意圖如圖2所示。該步驟中圖像縮放尺度的范圍是動(dòng)態(tài)變化的,即當(dāng)前幀圖像的縮放尺度范圍會(huì)受到前一幀圖像檢測(cè)結(jié)果的影響。優(yōu)選地,如果前一幀圖像在某個(gè)縮放尺度檢測(cè)出的人臉窗口數(shù)最多,那么新一幀圖像的縮放尺度被限定在該尺度周圍的數(shù)個(gè)尺度內(nèi)(即縮放尺度范圍內(nèi))。當(dāng)然,可以理解,也可以將縮放尺度范圍限定在人臉窗口數(shù)目較多的幾個(gè)縮放尺度組成的范圍內(nèi),或者以其他形式確定的范圍,在此不做限制。
[0047]此后進(jìn)入步驟103,生成圖像金字塔中每張縮放圖像的檢測(cè)窗口,并計(jì)算檢測(cè)窗口的積分圖。
[0048]檢測(cè)窗口是按照一定的步進(jìn)長(zhǎng)度對(duì)圖像進(jìn)行遍歷而得。積分圖中每個(gè)位置的值是原圖中對(duì)應(yīng)位置左上角區(qū)域所有像素的和。計(jì)算積分圖能夠加速計(jì)算AdaBoost算法類Haar特征的特征值。
[0049]此后進(jìn)入步驟104,判斷生成的檢測(cè)窗口是否含有人臉,并統(tǒng)計(jì)每張縮放圖像含有人臉的檢測(cè)窗口的數(shù)目和不含人臉的檢測(cè)窗口的數(shù)目,得到當(dāng)前幀的每張縮放圖像的第一人臉窗口概率值,以供下一幀圖像進(jìn)行縮放處理時(shí)使用,其中,第一人臉窗口概率值中的最大值越大,下一幀圖像的縮放尺度范圍越小,且第一人