一種基于體感識(shí)別的數(shù)字設(shè)備操控方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及自然人機(jī)交互技術(shù)領(lǐng)域,具體地說,涉及一種基于體感識(shí)別的數(shù)字設(shè) 備操控方法。
【背景技術(shù)】
[0002] 隨著電子技術(shù)和數(shù)字多媒體技術(shù)的發(fā)展,越來越多的數(shù)字設(shè)備進(jìn)入到人們的生活 當(dāng)中,為人們提供豐富的數(shù)據(jù)信息和生活上的舒適。
[0003] 電視作為最早進(jìn)入人們生活的電子設(shè)備也在進(jìn)行著數(shù)字化發(fā)展,近年來數(shù)字電視 產(chǎn)業(yè)的迅速發(fā)展為人們帶來了越來越清晰的視頻畫面和越來越豐富的音視頻內(nèi)容。但是, 用戶如何控制數(shù)字電視已成為產(chǎn)業(yè)內(nèi)關(guān)注的重要問題,甚至關(guān)乎數(shù)字電視產(chǎn)業(yè)的進(jìn)一步發(fā) 展。
[0004] 現(xiàn)有最為普遍的電視控制方式是通過傳統(tǒng)的紅外遙控器進(jìn)行控制。該方法更多 的是用于實(shí)現(xiàn)頻道跳轉(zhuǎn)和音量調(diào)整,因其價(jià)格低廉和技術(shù)成熟的優(yōu)勢(shì)被廣泛使用。但如果 用戶需要對(duì)電視進(jìn)行如文字輸入等更加復(fù)雜的控制操作,該方法就需要用戶進(jìn)行繁瑣的操 作,顯得力不從心。
[0005] 為解決傳統(tǒng)紅外遙控器無法進(jìn)行文字輸入等復(fù)雜控制操作的問題,又出現(xiàn)了通過 帶有擴(kuò)展按鍵的紅外遙控器對(duì)電視進(jìn)行控制的方法。該方法對(duì)傳統(tǒng)的紅外遙控器作了進(jìn)一 步的改進(jìn),增加了類似計(jì)算機(jī)鍵盤或手機(jī)鍵盤的按鍵,這些按鍵可以用于文字輸入等復(fù)雜 操作,簡(jiǎn)化了操作過程。但該方法中的紅外遙控器由于配制了大量的按鍵,體積較大,成本 較聞。
[0006] 同時(shí)還有通過新型無線設(shè)備進(jìn)行控制。該方法放棄傳統(tǒng)的或帶有擴(kuò)展按鍵的紅外 遙控器,而是使用基于藍(lán)牙或Wi-Fi數(shù)據(jù)通信的控制器,亦或是直接使用安裝有控制數(shù)字 電視應(yīng)用的智能手機(jī)等。該方法擴(kuò)大了數(shù)字電視的控制范圍,但其對(duì)無線環(huán)境和控制器要 求較高。
[0007] 隨著RGB-D傳感器的興起,數(shù)字電視的體感控制技術(shù)應(yīng)運(yùn)而生。該方法對(duì)數(shù)字電 視的操作控制不需要任何的手持設(shè)備,但是其操作多是基于時(shí)間停留的控制,用戶體檢不 佳。
[0008] 基于上述情況,亟需一種操作方便、用戶體驗(yàn)好、能夠?qū)崿F(xiàn)復(fù)雜控制操作的數(shù)字設(shè) 備操控方法。
【發(fā)明內(nèi)容】
[0009] 為解決上述問題,本發(fā)明提供了一種基于體感識(shí)別的數(shù)字設(shè)備操控方法,其包括 以下步驟:
[0010] 用戶權(quán)限管理步驟,當(dāng)檢測(cè)到有用戶發(fā)出的獲取控制權(quán)限的請(qǐng)求時(shí),在數(shù)字設(shè)備 的顯示區(qū)域內(nèi)顯示與該用戶對(duì)應(yīng)的操作控制框,并基于權(quán)限管理機(jī)制來給該用戶分配針對(duì) 數(shù)字設(shè)備的控制權(quán)限;
[0011] 用戶動(dòng)作識(shí)別步驟,根據(jù)用戶在所述操作控制框內(nèi)的動(dòng)作的識(shí)別來判斷是否要進(jìn) 行按鍵操作,如果是,在所述操作控制框內(nèi)布局鍵盤,并接下來基于用戶針對(duì)布局的鍵盤發(fā) 出的第一類動(dòng)作進(jìn)行識(shí)別;如果不是按鍵操作,則接下來基于用戶發(fā)出的第二類動(dòng)作進(jìn)行 識(shí)別;
[0012] 控制步驟,基于識(shí)別的結(jié)果按照預(yù)先設(shè)定的動(dòng)作與數(shù)字設(shè)備操作之間的對(duì)應(yīng)關(guān)系 來實(shí)現(xiàn)對(duì)數(shù)字設(shè)備的體感控制。
[0013] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,在用戶權(quán)限管理步驟中,用戶發(fā)出的獲取控制權(quán)限的 請(qǐng)求為揮手姿勢(shì),當(dāng)對(duì)應(yīng)于用戶的操作手在操作控制框上停頓一預(yù)定的時(shí)間后,給該用戶 分配控制權(quán)限,而當(dāng)對(duì)應(yīng)于用戶的操作手離開操作控制框另一預(yù)定的時(shí)間后,收回給該用 戶分配的控制權(quán)限。
[0014] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,控制權(quán)限在同一時(shí)間里只能分配給一個(gè)用戶。
[0015] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,在數(shù)字設(shè)備的顯示區(qū)域內(nèi)還分配了顯示監(jiān)控視頻界面 的區(qū)域,用于實(shí)時(shí)顯示用戶信息以及與操作控制框的交互動(dòng)態(tài)。
[0016] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,在用戶動(dòng)作識(shí)別步驟中,當(dāng)用戶發(fā)出的動(dòng)作達(dá)到靜態(tài) 動(dòng)作識(shí)別的時(shí)間閾值后,采集用戶的動(dòng)作數(shù)據(jù),對(duì)發(fā)出具體動(dòng)作的部位的圖像進(jìn)行分割來 定位,對(duì)定位得到的圖像基于特征提取和預(yù)先建立的靜態(tài)動(dòng)作模型進(jìn)行識(shí)別。
[0017] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,發(fā)出具體動(dòng)作的部位為手部,預(yù)先建立的靜態(tài)動(dòng)作模 型為手勢(shì)模型,手勢(shì)模型是通過采用Adaboost學(xué)習(xí)算法對(duì)獲取的樣本庫進(jìn)行分類訓(xùn)練而 得到的。
[0018] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,在用戶動(dòng)作識(shí)別步驟中,第一類動(dòng)作為手指點(diǎn)擊動(dòng)作, 并按照以下步驟識(shí)別手指點(diǎn)擊動(dòng)作:
[0019] 手部圖像二值化步驟,基于從體感器得到的掌心點(diǎn)三維位置對(duì)發(fā)出動(dòng)作的手部進(jìn) 行定位,并基于從體感器得到的深度信息來對(duì)定位的圖像進(jìn)行分割,從而得到手部區(qū)域的 二值圖像;
[0020] 手掌輪廓提取步驟,對(duì)得到的二值圖像進(jìn)行輪廓搜尋并基于手掌閾值確定得到手 掌輪廓圖像,對(duì)手掌輪廓圖像進(jìn)行邊緣擬合平滑處理,
[0021] 指尖點(diǎn)檢測(cè)步驟,基于葛立恒掃描法來得到輪廓圖像的凸包點(diǎn),并基于以下兩種 方式中的任何一種來篩選出指尖點(diǎn):
[0022] a、根據(jù)手指長(zhǎng)度篩選,相鄰的兩個(gè)凸包點(diǎn)與凹點(diǎn)構(gòu)成一個(gè)夾角,其兩邊邊長(zhǎng)之和 應(yīng)大于手長(zhǎng)的一半;
[0023]b、根據(jù)手指夾角篩選,相鄰的兩個(gè)凸包點(diǎn)與凹點(diǎn)構(gòu)成一個(gè)夾角,其夾角要小于60 度;
[0024] 指尖點(diǎn)標(biāo)記步驟,按以下兩種方式中的任何一種對(duì)指尖點(diǎn)進(jìn)行標(biāo)記以用于區(qū)分每 一根手指的點(diǎn)擊操作:
[0025]c、以掌心點(diǎn)為中心建立坐標(biāo)系,計(jì)算篩選出的指尖點(diǎn)與掌心的連線與X軸的夾角 度數(shù)大小,然后將計(jì)算出來的結(jié)果進(jìn)行排序進(jìn)行標(biāo)記;
[0026]d、通過篩選出的指尖點(diǎn)相對(duì)掌心的相對(duì)位置將其按順序標(biāo)記;
[0027] 點(diǎn)擊識(shí)別步驟,按以下兩種方式中的任何一種或者二者的結(jié)合進(jìn)行點(diǎn)擊動(dòng)作的識(shí) 別:
[0028] e、通過判斷相鄰指尖點(diǎn)和所述相鄰指尖點(diǎn)之間的凹陷點(diǎn)連線的夾角值是否大于 點(diǎn)擊閾值,如果是,則判斷為點(diǎn)擊事件;或/和
[0029] f、計(jì)算連續(xù)幀上指尖點(diǎn)深度信息的運(yùn)動(dòng)方差,根據(jù)所述運(yùn)動(dòng)方差的波動(dòng)來判斷點(diǎn) 擊事件。
[0030] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,在用戶動(dòng)作識(shí)別步驟中,第二類動(dòng)作為動(dòng)態(tài)手勢(shì)動(dòng)作, 并按照以下步驟識(shí)別所述動(dòng)態(tài)手勢(shì)動(dòng)作:
[0031] 有效動(dòng)態(tài)手勢(shì)提取步驟,以動(dòng)態(tài)手勢(shì)的運(yùn)動(dòng)、靜止和轉(zhuǎn)折作為動(dòng)態(tài)手勢(shì)軌跡提取 起始和結(jié)束的依據(jù),根據(jù)動(dòng)態(tài)手勢(shì)軌跡點(diǎn)數(shù)量閾值提取有效手勢(shì),并對(duì)有效手勢(shì)軌跡進(jìn)行 歸一化處理;
[0032] 動(dòng)態(tài)手勢(shì)特征值提取步驟,對(duì)相鄰幀內(nèi)掌心點(diǎn)連線的向量方向角的角度進(jìn)行方向 量化編碼,以量化編碼作為動(dòng)態(tài)手勢(shì)的特征值;
[0033] 動(dòng)態(tài)手勢(shì)識(shí)別步驟,基于動(dòng)態(tài)手勢(shì)特征值與預(yù)先建立的動(dòng)態(tài)手勢(shì)模型進(jìn)行動(dòng)態(tài)手 勢(shì)識(shí)別。
[0034] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,方向量化編碼為12個(gè)方向均勻量化編碼,每+量化為 一個(gè)方向。
[0035] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,動(dòng)態(tài)手勢(shì)模型是改進(jìn)的HMM模型,其能夠排除HMM模型 無法排除的無效手勢(shì),改進(jìn)的HMM模型是按以下方式中的任何一種或多種的結(jié)合進(jìn)行改進(jìn) 的:
[0036] g、利用統(tǒng)計(jì)學(xué)規(guī)律設(shè)置樣本軌跡的概率范圍;
[0037] h、設(shè)置動(dòng)態(tài)手勢(shì)軌跡點(diǎn)的個(gè)數(shù)范圍;
[0038] i、設(shè)置動(dòng)態(tài)手勢(shì)方