日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法

文檔序號(hào):7809561閱讀:419來源:國知局
一種基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法
【專利摘要】本發(fā)明公開了一種基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法,通過利用杜鵑搜索算法對(duì)對(duì)等網(wǎng)絡(luò)流量特征選擇問題優(yōu)化求解,從而可以快速的獲得對(duì)等網(wǎng)絡(luò)流量本質(zhì)屬性的最優(yōu)特征子集,可用于對(duì)等網(wǎng)絡(luò)流量識(shí)別和模式識(shí)別相關(guān)【技術(shù)領(lǐng)域】中。本發(fā)明能夠在可接受的時(shí)間代價(jià)內(nèi)找到特征選擇問題的高質(zhì)量的可行解,不需要人為指定要選擇的特征維數(shù),能夠智能的在正確識(shí)別率和特征維數(shù)之間取得很好的平衡,自動(dòng)尋找到比較合適的最優(yōu)特征子集。本發(fā)明利用杜鵑搜索算法對(duì)對(duì)等網(wǎng)絡(luò)中原始數(shù)據(jù)集進(jìn)行特征選擇,剔除不相關(guān)或冗余的對(duì)等網(wǎng)絡(luò)流量特征,取出真正相關(guān)的特征,節(jié)省對(duì)等網(wǎng)絡(luò)流量識(shí)別中特征提取的計(jì)算時(shí)間,從而提高對(duì)等網(wǎng)絡(luò)流量識(shí)別的效率和正確率。
【專利說明】一種基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于智能計(jì)算、計(jì)算機(jī)網(wǎng)絡(luò)和模式識(shí)別的交叉應(yīng)用領(lǐng)域,涉及模式識(shí)別方 法在計(jì)算機(jī)網(wǎng)絡(luò),尤其涉及該技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)中對(duì)等網(wǎng)絡(luò)流量識(shí)別問題,具體涉及一種 基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法。

【背景技術(shù)】
[0002] 對(duì)等網(wǎng)絡(luò)技術(shù)是無中心服務(wù)器、依靠用戶群交換信息的互聯(lián)網(wǎng)體系,是互聯(lián)網(wǎng)技 術(shù)的一個(gè)重要分支。與有傳統(tǒng)中心服務(wù)器的中央網(wǎng)絡(luò)系統(tǒng)不同,對(duì)等網(wǎng)絡(luò)的每個(gè)用戶端既 是客戶機(jī)器也是服務(wù)器。目前對(duì)等網(wǎng)絡(luò)技術(shù)被廣泛應(yīng)用于軍事、商業(yè)、政府信息、通訊等眾 多領(lǐng)域。美國《財(cái)富》雜志稱對(duì)等網(wǎng)絡(luò)技術(shù)是改變互聯(lián)網(wǎng)發(fā)展的四大新技術(shù)之一。據(jù)統(tǒng)計(jì) 對(duì)等網(wǎng)絡(luò)應(yīng)用在互聯(lián)網(wǎng)應(yīng)用占據(jù)80%左右的流量。在對(duì)等網(wǎng)絡(luò)快速發(fā)展的同時(shí),由于對(duì)等 網(wǎng)絡(luò)技術(shù)本身的特點(diǎn),對(duì)等網(wǎng)絡(luò)應(yīng)用對(duì)網(wǎng)絡(luò)運(yùn)營商的網(wǎng)絡(luò)質(zhì)量和用戶管理也帶來了巨大的 危害。
[0003] 為了使得對(duì)等網(wǎng)絡(luò)技術(shù)更好的為人們生產(chǎn)生活提供更好的服務(wù),有必要對(duì)對(duì)等網(wǎng) 絡(luò)流量的進(jìn)行控制和管理,首先要解決的問題是對(duì)等網(wǎng)絡(luò)流量的識(shí)別。在對(duì)等網(wǎng)絡(luò)流量識(shí) 別問題中,流量特征的提取和選擇對(duì)對(duì)等網(wǎng)絡(luò)流量識(shí)別有著重大的影響,單一的網(wǎng)絡(luò)流量 特征通常識(shí)別精度不高,而過多的流量特征會(huì)增加流量樣本特征抽取的工作量;此外過多 的特征會(huì)帶來維數(shù)災(zāi)問題,增加分類器的計(jì)算時(shí)間,降低分類器的性能。所以為了提高對(duì)等 網(wǎng)絡(luò)流量識(shí)別的正確率和減少計(jì)算工作量,在進(jìn)行對(duì)等網(wǎng)絡(luò)流量分類識(shí)別之前,需要對(duì)原 始的數(shù)據(jù)集進(jìn)行特征選擇,剔除不相關(guān)或冗余的對(duì)等網(wǎng)絡(luò)流量特征,盡可能選擇出最能代 表網(wǎng)絡(luò)流量樣本屬性的特征子集,以提高對(duì)等網(wǎng)絡(luò)流量識(shí)別的正確率。特征選擇也叫特征 子集選擇,是指從已有的Μ個(gè)特征中選擇N(N小于等于M)個(gè)特征使得系統(tǒng)的特定指標(biāo)最優(yōu) 化。特征選擇是影響分類準(zhǔn)確率的最重要的因素之一。實(shí)質(zhì)上對(duì)等網(wǎng)絡(luò)流量特征選擇問題 是一個(gè)計(jì)算時(shí)間復(fù)雜度為指數(shù)級(jí)別NP難求解問題,其時(shí)間復(fù)雜度為0(2 M),M為原始特征個(gè) 數(shù)。常用的求解算法如分支限界法,回溯法等只能求解規(guī)模很小的特征選擇問題。實(shí)際工 作中,特征選擇問題常被視為組合優(yōu)化問題,采用啟發(fā)式算法或者最優(yōu)化方法獲得它的近 似最優(yōu)解。


【發(fā)明內(nèi)容】

[0004] 杜鵑搜索算法是一種啟發(fā)式優(yōu)化算法,具有很強(qiáng)的全局尋優(yōu)能力,為了解決在對(duì) 等網(wǎng)絡(luò)流量特征問題,本發(fā)明提出一種基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法。
[0005] 本發(fā)明所采用的技術(shù)方案是:一種基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方 法,其特征在于,包括以下步驟:
[0006] 步驟1 :對(duì)獲取的網(wǎng)絡(luò)數(shù)據(jù)包進(jìn)行預(yù)處理并提取網(wǎng)絡(luò)流量特征,對(duì)網(wǎng)絡(luò)流量特征 進(jìn)行歸一化處理,得到原始特征樣本集,所述的原始特征樣本集作為輸入數(shù)據(jù)集;
[0007] 步驟2 :將輸入數(shù)據(jù)集作為完整的特征空間輸入到特征選擇算法中;
[0008] 步驟3 :初始化杜鵑搜索算法所需的參數(shù),得到算法的初始種群;
[0009] 步驟4:將杜鵑搜索算法中鳥巢的初始空間位置向量解碼成相應(yīng)的特征子集,利 用適應(yīng)度評(píng)價(jià)函數(shù)計(jì)算得到每個(gè)特征子集的適應(yīng)度函數(shù)值,比較每個(gè)鳥巢的適應(yīng)度函數(shù) 值,并記錄和保留當(dāng)前最優(yōu)鳥巢位置為A ;
[0010] 步驟5 :通過杜鵑搜索算法中的位置更新公式更新鳥巢的位置,得到一組新解并 計(jì)算其適應(yīng)度函數(shù)值,比較這組解的適應(yīng)度函數(shù)值并記其具有最優(yōu)適應(yīng)度函數(shù)值的位置為 B ;
[0011] 步驟6 :用隨機(jī)數(shù)r e [0, 1]與鳥巢的主人發(fā)現(xiàn)外來的鳥蛋概率Pa對(duì)比,并判斷:
[0012] 若r>pa,則通過列維飛行隨機(jī)改變鳥巢位置,得到一組新的鳥巢位置,并計(jì)算其適 應(yīng)度函數(shù)值,比較這組解的適應(yīng)度函數(shù)值并記其具有最優(yōu)適應(yīng)度函數(shù)值的位置為C ;
[0013] 若r < pa,則順序執(zhí)行下述步驟7 ;
[0014] 步驟7 :將位置B和C的適應(yīng)度函數(shù)值與上一代當(dāng)前最優(yōu)鳥巢位置A的適應(yīng)度函 數(shù)值進(jìn)行對(duì)比,若更好,則將其作為當(dāng)前的最優(yōu)鳥巢位置A ;
[0015] 步驟8 :判斷,是否滿足終止條件?
[0016] 若否,則回轉(zhuǎn)執(zhí)行所述的步驟5 ;
[0017] 若是,則解碼并輸出全局最優(yōu)鳥巢位置對(duì)應(yīng)的最優(yōu)特征子集。
[0018] 作為優(yōu)選,步驟1中所述的對(duì)獲取的網(wǎng)絡(luò)流量包進(jìn)行預(yù)處理,其具體實(shí)現(xiàn)過程是 利用網(wǎng)絡(luò)抓包工具分時(shí)段隨機(jī)抓取一定數(shù)量網(wǎng)絡(luò)數(shù)據(jù)包并存入樣本數(shù)據(jù)庫中,人工分析出 其中對(duì)等網(wǎng)絡(luò)包和普通網(wǎng)絡(luò)包的數(shù)量,對(duì)抓取的網(wǎng)絡(luò)數(shù)據(jù)包提取網(wǎng)絡(luò)流量特征。
[0019] 作為優(yōu)選,步驟1中所述的對(duì)對(duì)網(wǎng)絡(luò)流量特征進(jìn)行歸一化處理,采用的公式為:
[0020]

【權(quán)利要求】
1. 一種基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法,其特征在于,包括以下步 驟: 步驟1 :對(duì)獲取的網(wǎng)絡(luò)數(shù)據(jù)包進(jìn)行預(yù)處理并提取網(wǎng)絡(luò)流量特征,對(duì)網(wǎng)絡(luò)流量特征進(jìn)行 歸一化處理,得到原始特征樣本集,所述的原始特征樣本集作為輸入數(shù)據(jù)集; 步驟2 :將輸入數(shù)據(jù)集作為完整的特征空間輸入到特征選擇算法中; 步驟3 :初始化杜鵑搜索算法所需的參數(shù),得到算法的初始種群; 步驟4:將杜鵑搜索算法中鳥巢的初始空間位置向量解碼成相應(yīng)的特征子集,利用適 應(yīng)度評(píng)價(jià)函數(shù)計(jì)算得到每個(gè)特征子集的適應(yīng)度函數(shù)值,比較每個(gè)鳥巢的適應(yīng)度函數(shù)值,記 錄并保留當(dāng)前最優(yōu)鳥巢位置為A ; 步驟5:通過杜鵑搜索算法中的位置更新公式更新鳥巢的位置,得到一組新解并計(jì)算 其適應(yīng)度函數(shù)值,比較這組解的適應(yīng)度函數(shù)值并記其具有最優(yōu)適應(yīng)度函數(shù)值的位置為B ; 步驟6 :用隨機(jī)數(shù)r e [〇, 1]與鳥巢的主人發(fā)現(xiàn)外來的鳥蛋概率Pa對(duì)比,并判斷: 若r>pa,則通過列維飛行隨機(jī)改變鳥巢位置,得到一組新的鳥巢位置,并計(jì)算其適應(yīng)度 函數(shù)值,比較這組解的適應(yīng)度函數(shù)值并記其具有最優(yōu)適應(yīng)度函數(shù)值的位置為C ; 若r < pa,則順序執(zhí)行下述步驟7 ; 步驟7 :將位置B和C的適應(yīng)度函數(shù)值與上一代當(dāng)前最優(yōu)鳥巢位置A的適應(yīng)度函數(shù)值 進(jìn)行對(duì)比,若更好,則將其作為當(dāng)前的最優(yōu)鳥巢位置A ; 步驟8 :判斷,是否滿足終止條件? 若否,則回轉(zhuǎn)執(zhí)行所述的步驟5 ; 若是,則解碼并輸出全局最優(yōu)鳥巢位置對(duì)應(yīng)的最優(yōu)特征子集。
2. 根據(jù)權(quán)利要求1所述的基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法,其特征在 于:步驟1中所述的對(duì)獲取的網(wǎng)絡(luò)流量包進(jìn)行預(yù)處理,其具體實(shí)現(xiàn)過程是利用網(wǎng)絡(luò)抓包工 具分時(shí)段隨機(jī)抓取一定數(shù)量網(wǎng)絡(luò)數(shù)據(jù)包并存入樣本數(shù)據(jù)庫中,人工分析出其中對(duì)等網(wǎng)絡(luò)包 和普通網(wǎng)絡(luò)包的數(shù)量,對(duì)抓取的網(wǎng)絡(luò)數(shù)據(jù)包提取網(wǎng)絡(luò)流量特征。
3. 根據(jù)權(quán)利要求1所述的基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法,其特征在 于:步驟1中所述的對(duì)對(duì)網(wǎng)絡(luò)流量特征進(jìn)行歸一化處理,采用的公式為:
A'表示特征v的原始值A(chǔ)映射到[0, 1]之間的歸一化值,111;[1^表示特征v的最小值, maxv表示特征v的最大值。
4. 根據(jù)權(quán)利要求1所述的基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法,其特征在 于:步驟3中所述的初始化杜鵑搜索算法所需的參數(shù)包括迭代次數(shù)Iter、杜鵑的種群規(guī)模 N、被發(fā)現(xiàn)的概率pa、速度步長控制參數(shù)α、列維飛行步長控制參數(shù)λ、鳥巢的初始空間位 置。
5. 根據(jù)權(quán)利要求1所述的基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法,其特征在 于:步驟4中所述的將杜鵑搜索算法中鳥巢的初始空間位置向量解碼成相應(yīng)的特征子集, 是利用sigmoid公式將杜鵑搜索算法中鳥巢的初始空間位置向量解碼成相應(yīng)的特征子集, sigmoid公式為:
其中4(0表示第t次迭代時(shí)第i個(gè)鳥巢的第d維的空間位置,是一個(gè)實(shí)數(shù),e是自然底 數(shù),σ是一個(gè)數(shù)值范圍是[〇, 1]服從均勻分布的隨機(jī)數(shù)。
6. 根據(jù)權(quán)利要求1所述的基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法,其特征在 于:步驟4中所述的利用適應(yīng)度評(píng)價(jià)函數(shù)計(jì)算得到每個(gè)特征子集的適應(yīng)度函數(shù)值,其適應(yīng) 度函數(shù)值計(jì)算公式為:
這里Fitness (i)表示鳥巢i的適應(yīng)度函數(shù)值,correct-rate (i)表示利用鳥巢i選擇 的特征子集進(jìn)行對(duì)等網(wǎng)絡(luò)流量識(shí)別的正確率,num(i)表示此次選擇的特征個(gè)數(shù),ω是特征 個(gè)數(shù)的權(quán)重參數(shù)。
7. 根據(jù)權(quán)利要求1所述的基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法,其特征在 于:步驟5中所述的通過杜鵑搜索算法中的位置更新公式更新鳥巢的位置,其位置更新公 式為: Xj (t+1) = Xj (t) + a ? Levy ( λ ) 其中ct是速度步長控制量并且α>〇, ?表示點(diǎn)對(duì)點(diǎn)乘法,LevyO)是均勻Levy分布 隨機(jī)數(shù),服從Levy?u = fλ (1〈 λ < 3),i表示第i個(gè)鳥巢的位置,t表示迭代次數(shù),λ是 列維飛行步長控制參數(shù)。
8. 根據(jù)權(quán)利要求1所述的基于杜鵑搜索算法的對(duì)等網(wǎng)絡(luò)流量特征選擇方法,其特征在 于:步驟8中所述的終止條件為達(dá)到預(yù)設(shè)的最大運(yùn)行迭代數(shù)。
【文檔編號(hào)】H04L12/801GK104092618SQ201410352930
【公開日】2014年10月8日 申請(qǐng)日期:2014年7月23日 優(yōu)先權(quán)日:2014年7月23日
【發(fā)明者】葉志偉, 李沁沄, 王明威, 王春枝, 劉偉, 陳宏偉, 徐慧, 宗欣露, 尹宇潔, 喻東陽 申請(qǐng)人:湖北工業(yè)大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1