本領(lǐng)域涉及信息安全,尤其涉及一種流量確定的方法、裝置、設(shè)備、計算機存儲介質(zhì)及計算機程序產(chǎn)品。
背景技術(shù):
1、云計算作為一種成熟的技術(shù)被廣泛應(yīng)用于生活的各個領(lǐng)域。憑借云服務(wù)器的強大的資源存儲能力和計算能力,用戶和企業(yè)在工作中得到了極大的便利。但是,目前存在大量的黑客惡意攻擊云計算平臺的行為,對保證云計算平臺用戶的數(shù)據(jù)安全提出了挑戰(zhàn)。
2、相關(guān)技術(shù)中,通常采用入侵檢測算法檢測訪問流量是否具有攻擊性質(zhì),但是入侵檢測算法仍然會把部分訪問流量分類錯誤,因此檢測出攻擊流量的準(zhǔn)確性比較低。
技術(shù)實現(xiàn)思路
1、本公開實施例提供一種流量確定的方法、裝備、設(shè)備、計算機存儲介質(zhì)和計算機程序產(chǎn)品,能夠提高檢測出攻擊流量的準(zhǔn)確性。
2、第一方面,本公開實施例提供一種流量確定的方法,方法包括:
3、獲取待檢測網(wǎng)絡(luò)流量數(shù)據(jù),待檢測網(wǎng)絡(luò)流量數(shù)據(jù)包括多個特征數(shù)據(jù);
4、計算多個特征數(shù)據(jù)之間的第一互信息值,第一互信息值表征多個特征數(shù)據(jù)中任意兩個特征數(shù)據(jù)的關(guān)聯(lián)程度;
5、基于多個特征數(shù)據(jù)之間的第一互信息值,從多個特征數(shù)據(jù)中獲取第一互信息值大于或等于第一閾值的特征數(shù)據(jù)作為第一目標(biāo)特征集合;
6、將第一目標(biāo)特征集合輸入目標(biāo)模型中的第一模型,利用第一模型對第一目標(biāo)特征集合分類,確定初始預(yù)測目標(biāo)結(jié)果和初始預(yù)測非目標(biāo)結(jié)果;
7、將初始預(yù)測目標(biāo)結(jié)果和初始預(yù)測非目標(biāo)結(jié)果輸入目標(biāo)模型中的第二模型,利用第二模型對初始預(yù)測目標(biāo)結(jié)果和初始預(yù)測非目標(biāo)結(jié)果二次分類得到當(dāng)前預(yù)測目標(biāo)結(jié)果。
8、在一個可以實現(xiàn)的實施方式中,基于多個特征數(shù)據(jù)之間的第一互信息值,從多個特征數(shù)據(jù)中獲取第一互信息值大于或等于第一閾值的特征數(shù)據(jù)作為第一目標(biāo)特征集合,包括:
9、獲取第一互信息值大于或等于第一閾值的第一特征數(shù)據(jù)的第一數(shù)量;
10、在第一數(shù)量等于第二閾值的情況下,獲取第一特征數(shù)據(jù)作為第一目標(biāo)特征集合。
11、在一個可以實現(xiàn)的實施方式中,在獲取第一互信息值大于或等于第一閾值的第一特征數(shù)據(jù)的第一數(shù)量后,方法還包括:
12、在第一數(shù)量大于第二閾值的情況下,確定第一特征數(shù)據(jù)的第一互信息值大于或等于目標(biāo)第一閾值的第二特征數(shù)據(jù);其中目標(biāo)第一閾值大于第一閾值;
13、在第二特征數(shù)據(jù)的數(shù)量等于第二閾值的情況下,確定第二特征數(shù)據(jù)為第二目標(biāo)特征集合。
14、在一個可以實現(xiàn)的實施方式中,在將第一目標(biāo)特征集合輸入目標(biāo)模型中的第一模型,利用第一模型對第一目標(biāo)特征集合分類,確定初始預(yù)測目標(biāo)結(jié)果和初始預(yù)測非目標(biāo)結(jié)果之前,方法還包括:
15、獲取歷史目標(biāo)流量數(shù)據(jù)和歷史非目標(biāo)流量數(shù)據(jù),歷史目標(biāo)流量數(shù)據(jù)的數(shù)量小于歷史非目標(biāo)流量數(shù)據(jù)的數(shù)量,歷史目標(biāo)流量數(shù)據(jù)包括多個特征類型不同的歷史目標(biāo)子流量數(shù)據(jù),特征類型基于特征數(shù)據(jù)確定;
16、將多個歷史目標(biāo)子流量數(shù)據(jù)的特征數(shù)據(jù)輸入生成式對抗網(wǎng)絡(luò)模型,得到多個對應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合;
17、基于歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合訓(xùn)練目標(biāo)模型。
18、在一個可以實現(xiàn)的實施方式中,將多個歷史目標(biāo)子流量數(shù)據(jù)的特征數(shù)據(jù)輸入生成式對抗網(wǎng)絡(luò)模型,得到多個對應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合,包括:
19、構(gòu)建生成器網(wǎng)絡(luò)模型和判別器網(wǎng)絡(luò)模型,生成器網(wǎng)絡(luò)模型和判別器網(wǎng)絡(luò)模型組合得到生成式對抗網(wǎng)絡(luò)模型;
20、根據(jù)判別器網(wǎng)絡(luò)模型,對生成器網(wǎng)絡(luò)模型生成的樣本數(shù)據(jù)與歷史目標(biāo)子流量數(shù)據(jù)進行區(qū)分,得到訓(xùn)練好的生成式對抗網(wǎng)絡(luò)模型;
21、利用多個歷史目標(biāo)子流量數(shù)據(jù)的特征數(shù)據(jù),調(diào)整訓(xùn)練好的生成式對抗網(wǎng)絡(luò)模型的超參數(shù),得到目標(biāo)生成式對抗網(wǎng)絡(luò)模型;
22、基于目標(biāo)生成式對抗網(wǎng)絡(luò)模型,生成多個特征類型不同的目標(biāo)子流量數(shù)據(jù);
23、將多個特征類型不同的目標(biāo)子流量數(shù)據(jù)與對應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)合并,得到多個對應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合。
24、在一個可以實現(xiàn)的實施方式中,在基于歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合訓(xùn)練目標(biāo)模型之前,方法還包括:
25、利用jaccard系數(shù),獲取不同歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合的特征數(shù)據(jù)之間的相似度;
26、在相似度大于第三閾值的情況下,獲取相似度對應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合的樣本數(shù)量;
27、在相似度對應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合的樣本數(shù)量均小于第四閾值的情況下,合并相似度對應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合的樣本數(shù)量,得到組合歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合;
28、基于歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合訓(xùn)練目標(biāo)模型,包括:
29、基于歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合、多個歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合和組合歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合,訓(xùn)練目標(biāo)模型。
30、在一個可以實現(xiàn)的實施方式中,基于歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合訓(xùn)練目標(biāo)模型,包括:
31、將歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合輸入目標(biāo)模型中的第一模型,利用第一模型對樣本集合分類,確定預(yù)測目標(biāo)結(jié)果和預(yù)測非目標(biāo)結(jié)果;
32、將預(yù)測目標(biāo)結(jié)果和預(yù)測非目標(biāo)結(jié)果輸入目標(biāo)模型中的第二模型,利用第二模型對預(yù)測目標(biāo)結(jié)果和預(yù)測非目標(biāo)結(jié)果二次分類得到第一預(yù)測目標(biāo)結(jié)果。
33、在一個可以實現(xiàn)的實施方式中,第一模型包括支持向量機模型,在將歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合輸入目標(biāo)模型中的第一模型,利用第一模型對樣本集合分類,確定預(yù)測目標(biāo)結(jié)果和預(yù)測非目標(biāo)結(jié)果之前,方法還包括:
34、對粒子群算法的參數(shù)初始化并獲取多個粒子的適應(yīng)度,其中粒子表征一組支持向量機模型的懲罰參數(shù)和內(nèi)核參數(shù),粒子群算法的參數(shù)包括慣性權(quán)值;
35、將多個粒子的適應(yīng)度求和,得到第一適應(yīng)度;
36、將第一適應(yīng)度除以多個粒子對應(yīng)的數(shù)量,得到種群平均適應(yīng)度;
37、從多個粒子中任意選取兩個粒子;
38、將兩個粒子中的適應(yīng)度值最低的歷史最小適應(yīng)度作為目標(biāo)適應(yīng)度,粒子的歷史最小適應(yīng)度基于多次迭代得到的多個適應(yīng)度確定;
39、將多個粒子的適應(yīng)度分別與種群平均適應(yīng)度相除,得到第二適應(yīng)度;
40、將第二適應(yīng)度與第五閾值比較,得到比較結(jié)果;
41、在比較結(jié)果表征第二適應(yīng)度大于或等于第五閾值的情況下,任意選取兩個粒子適應(yīng)度中的較小適應(yīng)度對應(yīng)的位置作為粒子更新后位置;
42、獲取粒子位置更新后的目標(biāo)適應(yīng)度;
43、在目標(biāo)適應(yīng)度小于適應(yīng)度閾值的情況下,獲取目標(biāo)適應(yīng)度對應(yīng)的懲罰參數(shù)和內(nèi)核參數(shù)作為最佳懲罰參數(shù)和最佳內(nèi)核參數(shù);
44、基于最佳懲罰參數(shù)和最佳內(nèi)核參數(shù)得到參數(shù)調(diào)整后的支持向量機模型。
45、在一個可以實現(xiàn)的實施方式中,對粒子群算法的參數(shù)初始化并獲取多個粒子的適應(yīng)度,包括:
46、利用迭代次數(shù)和隨機數(shù)之間的對應(yīng)關(guān)系更新慣性權(quán)值,得到更新后的慣性權(quán)值。
47、在一個可以實現(xiàn)的實施方式中,對粒子群算法的參數(shù)初始化并獲取多個粒子的適應(yīng)度,包括:
48、根據(jù)粒子對應(yīng)的支持向量機模型分類錯誤的次數(shù)與總分類次數(shù)的比值評估粒子的適應(yīng)度。
49、在一個可以實現(xiàn)的實施方式中,第二模型包括孤立森林模型,將預(yù)測目標(biāo)結(jié)果和預(yù)測非目標(biāo)結(jié)果輸入目標(biāo)模型中的第二模型,利用第二模型對預(yù)測目標(biāo)結(jié)果和預(yù)測非目標(biāo)結(jié)果二次分類得到第一預(yù)測目標(biāo)結(jié)果,包括:
50、將預(yù)測目標(biāo)結(jié)果和預(yù)測非目標(biāo)結(jié)果輸入目標(biāo)模型中的孤立森林模型,利用孤立森林模型分別獲取預(yù)測目標(biāo)結(jié)果和預(yù)測非目標(biāo)結(jié)果中的離群點,離群點對應(yīng)一種預(yù)測結(jié)果;
51、獲取預(yù)測目標(biāo)結(jié)果中除離群點之外的所有點,得到第二預(yù)測目標(biāo)結(jié)果;
52、利用孤立森林模型對預(yù)測目標(biāo)結(jié)果和預(yù)測非目標(biāo)結(jié)果的離群點進行二次分類,得到預(yù)測結(jié)果為預(yù)測目標(biāo)結(jié)果的第一離群點;
53、將第一離群點和第二預(yù)測目標(biāo)結(jié)果合并,得到第一預(yù)測目標(biāo)結(jié)果。
54、第二方面,本公開實施例提供了一種流量確定的裝置,裝置包括:
55、獲取模塊,用于獲取待檢測網(wǎng)絡(luò)流量數(shù)據(jù),待檢測網(wǎng)絡(luò)流量數(shù)據(jù)包括多個特征數(shù)據(jù);
56、計算模塊,用于計算多個特征數(shù)據(jù)之間的第一互信息值,第一互信息值表征多個特征數(shù)據(jù)中任意兩個特征數(shù)據(jù)的關(guān)聯(lián)程度;
57、獲取模塊,還用于基于多個特征數(shù)據(jù)之間的第一互信息值,從多個特征數(shù)據(jù)中獲取第一互信息值大于或等于第一閾值的特征數(shù)據(jù)作為第一目標(biāo)特征集合;
58、確定模塊,用于將第一目標(biāo)特征集合輸入目標(biāo)模型中的第一模型,利用第一模型對第一目標(biāo)特征集合分類,確定初始預(yù)測目標(biāo)結(jié)果和初始預(yù)測非目標(biāo)結(jié)果;
59、獲取模塊,還用于將初始預(yù)測目標(biāo)結(jié)果和初始預(yù)測非目標(biāo)結(jié)果輸入目標(biāo)模型中的第二模型,利用第二模型對初始預(yù)測目標(biāo)結(jié)果和初始預(yù)測非目標(biāo)結(jié)果二次分類得到當(dāng)前預(yù)測目標(biāo)結(jié)果。
60、第三方面,本公開實施例提供了一種流量確定的設(shè)備,設(shè)備包括處理器,以及存儲有計算機程序指令的存儲器;處理器讀取并執(zhí)行計算機程序指令,以實現(xiàn)如第一方面的任意一項的流量確定的方法。
61、第四方面,本公開實施例提供了一種計算機可讀存儲介質(zhì),計算機可讀存儲介質(zhì)存儲有計算機程序指令,計算機程序指令被處理器執(zhí)行時實現(xiàn)如第一方面的任意一項的流量確定的方法。
62、第五方面,本公開實施例提供了一種計算機程序產(chǎn)品,包括計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)如第一方面的任意一項的流量確定的方法。
63、本公開實施例提供一種流量確定的方法、裝置、設(shè)備、計算機存儲介質(zhì)和計算機程序產(chǎn)品,獲取待檢測網(wǎng)絡(luò)流量數(shù)據(jù),待檢測網(wǎng)絡(luò)流量數(shù)據(jù)包括多個特征數(shù)據(jù)。計算多個特征數(shù)據(jù)之間的第一互信息值,第一互信息值表征多個特征數(shù)據(jù)中任意兩個特征數(shù)據(jù)的關(guān)聯(lián)程度?;诙鄠€特征數(shù)據(jù)之間的第一互信息值,從多個特征數(shù)據(jù)中獲取第一互信息值大于或等于第一閾值的特征數(shù)據(jù)作為第一目標(biāo)特征集合。利用第一閾值篩選第一互信息值較大的特征數(shù)據(jù),能夠提高分類結(jié)果的準(zhǔn)確性。將第一目標(biāo)特征集合輸入目標(biāo)模型中的第一模型,利用第一模型對第一目標(biāo)特征集合分類,確定初始預(yù)測目標(biāo)結(jié)果和初始預(yù)測非目標(biāo)結(jié)果。將初始預(yù)測目標(biāo)結(jié)果和初始預(yù)測非目標(biāo)結(jié)果輸入目標(biāo)模型中的第二模型,利用第二模型對初始預(yù)測目標(biāo)結(jié)果和初始預(yù)測非目標(biāo)結(jié)果二次分類得到當(dāng)前預(yù)測目標(biāo)結(jié)果。通過利用第二模型對第一模型的分類結(jié)果二次分類,能夠減少錯誤分類的概率,提高檢測出攻擊流量的準(zhǔn)確性。