本技術(shù)涉及通信,尤其涉及一種故障預(yù)測模型訓(xùn)練方法、故障預(yù)測方法、裝置及設(shè)備。
背景技術(shù):
1、隨著5g技術(shù)的發(fā)展,運營商通過網(wǎng)絡(luò)設(shè)備組成的運維支撐網(wǎng),為用戶提供了多樣化、高質(zhì)量的通信服務(wù)。
2、隨著運維支撐網(wǎng)規(guī)模的不斷擴大,網(wǎng)絡(luò)設(shè)備發(fā)生故障的現(xiàn)象也十分普遍。在網(wǎng)絡(luò)設(shè)備發(fā)生故障時,會對相應(yīng)區(qū)域內(nèi)終端的通信過程產(chǎn)生不利的影響。因此,及時預(yù)測出網(wǎng)絡(luò)設(shè)備可能產(chǎn)生的故障,對于保障網(wǎng)絡(luò)通信正常具有重要的意義。
3、然而,目前的網(wǎng)絡(luò)設(shè)備的故障預(yù)測主要是基于人工經(jīng)驗來實現(xiàn)的,這種預(yù)測方式過于依賴人工的經(jīng)驗,準確性較低。
技術(shù)實現(xiàn)思路
1、本技術(shù)提供一種故障預(yù)測模型訓(xùn)練方法、故障預(yù)測方法、裝置及設(shè)備,以提高網(wǎng)絡(luò)設(shè)備故障預(yù)測的準確性。
2、第一方面,本技術(shù)提供一種故障預(yù)測模型訓(xùn)練方法,包括:
3、獲取預(yù)設(shè)時段內(nèi)、多個樣本網(wǎng)絡(luò)設(shè)備的設(shè)備指標數(shù)據(jù);
4、根據(jù)所述設(shè)備指標數(shù)據(jù),得到所述多個樣本網(wǎng)絡(luò)設(shè)備的故障數(shù)量類特征、故障頻次類特征、故障時間類特征、距離與拓撲類特征、設(shè)備類特征,以及所述多個樣本網(wǎng)絡(luò)設(shè)備各自的標簽,所述標簽用于指示在所述預(yù)設(shè)時段內(nèi)對應(yīng)的樣本網(wǎng)絡(luò)設(shè)備是否發(fā)生故障;
5、對所述故障數(shù)量類特征、所述故障頻次類特征、所述故障時間類特征、所述距離與拓撲類特征和所述設(shè)備類特征進行分層特征選擇處理,得到特征數(shù)據(jù)集;
6、將所述特征數(shù)據(jù)集輸入至故障預(yù)測模型,得到故障預(yù)測模型輸出的樣本預(yù)測結(jié)果,所述樣本預(yù)測結(jié)果用于指示所述多個樣本網(wǎng)絡(luò)設(shè)備在所述預(yù)設(shè)時段內(nèi)發(fā)生故障的概率;
7、根據(jù)所述樣本預(yù)測結(jié)果和所述標簽,對所述故障預(yù)測模型的參數(shù)進行調(diào)整。
8、在一種可能的實施方式中,所述根據(jù)所述設(shè)備指標數(shù)據(jù),得到所述多個樣本網(wǎng)絡(luò)設(shè)備的故障數(shù)量類特征、故障頻次類特征、故障時間類特征、距離與拓撲類特征、設(shè)備類特征,以及所述多個樣本網(wǎng)絡(luò)設(shè)備各自的標簽,包括:
9、確定所述預(yù)設(shè)時段對應(yīng)的多個時間窗口;
10、根據(jù)所述多個時間窗口,以及所述設(shè)備指標數(shù)據(jù)對應(yīng)的時間信息,對所述設(shè)備指標數(shù)據(jù)進行劃分,得到所述故障數(shù)量類特征、所述故障頻次類特征和所述距離與拓撲類特征;
11、根據(jù)所述設(shè)備指標數(shù)據(jù)中包括的故障間隔數(shù)據(jù),生成所述故障時間類特征;
12、根據(jù)所述設(shè)備指標數(shù)據(jù)中包括的設(shè)備數(shù)據(jù),生成所述設(shè)備類特征;
13、根據(jù)所述設(shè)備指標數(shù)據(jù)中包括的故障數(shù)量數(shù)據(jù),生成所述標簽。
14、在一種可能的實施方式中,所述根據(jù)所述多個時間窗口,以及所述設(shè)備指標數(shù)據(jù)對應(yīng)的時間信息,對所述設(shè)備指標數(shù)據(jù)進行劃分,得到所述故障數(shù)量類特征、所述故障頻次類特征和所述距離與拓撲類特征,包括:
15、根據(jù)所述多個時間窗口和所述時間信息,對所述設(shè)備指標數(shù)據(jù)中包括的故障數(shù)量數(shù)據(jù)進行數(shù)據(jù)增強處理,得到所述故障數(shù)量類特征;
16、根據(jù)所述多個時間窗口和所述時間信息,對所述設(shè)備指標數(shù)據(jù)中包括的故障頻次數(shù)據(jù)進行數(shù)據(jù)增強處理,得到所述故障頻次類特征;
17、根據(jù)所述多個時間窗口和所述時間信息,對所述設(shè)備指標數(shù)據(jù)中包括的距離與拓撲類數(shù)據(jù)進行數(shù)據(jù)增強處理,得到所述距離與拓撲類類特征。
18、在一種可能的實施方式中,所述對所述故障數(shù)量類特征、所述故障頻次類特征、所述故障時間類特征、所述距離與拓撲類特征和所述設(shè)備類特征進行分層特征選擇處理,得到特征數(shù)據(jù)集,包括:
19、對所述故障數(shù)量類特征、所述故障頻次類特征和所述故障時間類特征分別進行單特征選擇處理,依次得到對應(yīng)的目標數(shù)量特征、目標頻次特征和目標時間特征;
20、對所述目標數(shù)量特征、所述目標頻次特征、所述目標時間特征、所述距離與拓撲類特征和所述設(shè)備類特征進行多特征選擇處理,得到第一特征集合;
21、根據(jù)所述第一特征集合、所述距離與拓撲類特征和所述設(shè)備類特征,生成第一特征數(shù)據(jù)集、第二特征數(shù)據(jù)集和第三特征數(shù)據(jù)集,所述特征數(shù)據(jù)集包括所述第一特征數(shù)據(jù)集、所述第二特征數(shù)據(jù)集和所述第三特征數(shù)據(jù)集。
22、在一種可能的實施方式中,所述對所述故障數(shù)量類特征、所述故障頻次類特征和所述故障時間類特征分別進行單特征選擇處理,依次得到對應(yīng)的目標數(shù)量特征、目標頻次特征和目標時間特征,包括:
23、對所述故障數(shù)量類特征、所述故障頻次類特征和所述故障時間類特征分別進行信息熵計算,得到所述故障數(shù)量類特征、所述故障頻次類特征和所述故障時間類特征各自的信息熵;
24、根據(jù)預(yù)設(shè)信息熵閾值和所述故障數(shù)量類特征的信息熵,對所述故障數(shù)量類特征進行篩選,得到所述目標數(shù)量特征;
25、根據(jù)所述預(yù)設(shè)信息熵閾值和所述故障頻次類特征的信息熵,對所述故障頻次類特征進行篩選,得到所述目標頻次特征;
26、根據(jù)所述預(yù)設(shè)信息熵閾值和所述故障時間類特征的信息熵,對所述故障時間類特征進行篩選,得到所述目標時間特征。
27、在一種可能的實施方式中,所述對所述目標數(shù)量特征、所述目標頻次特征、所述目標時間特征、所述距離與拓撲類特征和所述設(shè)備類特征進行多特征選擇處理,得到第一特征集合,包括:
28、對所述目標數(shù)量特征、所述目標頻次特征和所述目標時間特征進行卡方校驗處理,得到所述目標數(shù)量特征、所述目標頻次特征、所述目標時間特征之間的相關(guān)性;
29、根據(jù)所述相關(guān)性,以及所述故障數(shù)量類特征、所述故障頻次類特征和所述故障時間類特征各自的信息熵,對所述目標數(shù)量特征、所述目標頻次特征和所述目標時間特征進行篩選處理,得到篩選后的特征;
30、將所述篩選后的特征、所述距離與拓撲類特征和所述設(shè)備類特征進行合并處理,得到所述第一特征集合。
31、在一種可能的實施方式中,所述根據(jù)所述第一特征集合、所述距離與拓撲類特征和所述設(shè)備類特征,生成第一特征數(shù)據(jù)集、第二特征數(shù)據(jù)集和第三特征數(shù)據(jù)集,包括:
32、對所述第一特征集合中的特征進行隨機抽樣處理,得到隨機抽樣特征;
33、對所述距離與拓撲類特征,和所述隨機抽樣特征進行去重處理和合并處理,得到所述第一特征數(shù)據(jù)集;
34、對所述設(shè)備類特征和所述隨機抽樣特征進行去重處理和合并處理,得到所述第二特征數(shù)據(jù)集;
35、根據(jù)所述隨機抽樣特征得到所述第三特征數(shù)據(jù)集。
36、在一種可能的實施方式中,所述故障預(yù)測模塊包括k最臨近子模型、支持向量機子模型和梯度提升樹子模型;所述將所述特征數(shù)據(jù)集輸入至故障預(yù)測模型,得到故障預(yù)測模型輸出的樣本預(yù)測結(jié)果,包括:
37、將所述第一特征數(shù)據(jù)集輸入至所述k最臨近子模型,得到第一樣本預(yù)測結(jié)果;
38、將所述第二特征數(shù)據(jù)集輸入至所述支持向量機子模型,得到第二樣本預(yù)測結(jié)果;
39、將所述第三特征數(shù)據(jù)集輸入至所述梯度提升樹子模型,得到第三樣本預(yù)測結(jié)果;
40、對所述第一樣本預(yù)測結(jié)果、所述第二樣本預(yù)測結(jié)果和所述第三樣本預(yù)測結(jié)果進行加權(quán)處理,得到所述樣本預(yù)測結(jié)果。
41、第二方面,本技術(shù)提供一種故障預(yù)測方法,包括:
42、獲取目標網(wǎng)絡(luò)設(shè)備的目標設(shè)備指標數(shù)據(jù);
43、根據(jù)所述目標設(shè)備指標數(shù)據(jù),生成所述目標網(wǎng)絡(luò)設(shè)備的目標特征數(shù)據(jù)集;
44、將所述目標特征數(shù)據(jù)集輸入至故障預(yù)測模型,得到所述目標網(wǎng)絡(luò)設(shè)備的預(yù)測結(jié)果,所述預(yù)測結(jié)果用于指示所述目標網(wǎng)絡(luò)設(shè)備是否會發(fā)生故障,其中,所述故障預(yù)測模型為根據(jù)第一方面任一項的故障預(yù)測模型訓(xùn)練方法訓(xùn)練得到的模型。
45、第三方面,本技術(shù)提供一種故障預(yù)測模型訓(xùn)練裝置,包括:
46、第一獲取模塊,用于獲取預(yù)設(shè)時段內(nèi)、多個樣本網(wǎng)絡(luò)設(shè)備的設(shè)備指標數(shù)據(jù);
47、第一特征處理模塊,用于根據(jù)所述設(shè)備指標數(shù)據(jù),得到所述多個樣本網(wǎng)絡(luò)設(shè)備的故障數(shù)量類特征、故障頻次類特征、故障時間類特征、距離與拓撲類特征、設(shè)備類特征,以及所述多個樣本網(wǎng)絡(luò)設(shè)備各自的標簽,所述標簽用于指示在所述預(yù)設(shè)時段內(nèi)對應(yīng)的樣本網(wǎng)絡(luò)設(shè)備是否發(fā)生故障;
48、第二特征處理模塊,用于對所述故障數(shù)量類特征、所述故障頻次類特征、所述故障時間類特征、所述距離與拓撲類特征和所述設(shè)備類特征進行分層特征選擇處理,得到特征數(shù)據(jù)集;
49、輸入模塊,用于將所述特征數(shù)據(jù)集輸入至故障預(yù)測模型,得到故障預(yù)測模型輸出的樣本預(yù)測結(jié)果,所述樣本預(yù)測結(jié)果用于指示所述多個樣本網(wǎng)絡(luò)設(shè)備在所述預(yù)設(shè)時段內(nèi)發(fā)生故障的概率;
50、訓(xùn)練模塊,用于根據(jù)所述樣本預(yù)測結(jié)果和所述標簽,對所述故障預(yù)測模型的參數(shù)進行調(diào)整。
51、在一種可能的實施方式中,所述第一特征處理模塊具體用于:
52、確定所述預(yù)設(shè)時段對應(yīng)的多個時間窗口;
53、根據(jù)所述多個時間窗口,以及所述設(shè)備指標數(shù)據(jù)對應(yīng)的時間信息,對所述設(shè)備指標數(shù)據(jù)進行劃分,得到所述故障數(shù)量類特征、所述故障頻次類特征和所述距離與拓撲類特征;
54、根據(jù)所述設(shè)備指標數(shù)據(jù)中包括的故障間隔數(shù)據(jù),生成所述故障時間類特征;
55、根據(jù)所述設(shè)備指標數(shù)據(jù)中包括的設(shè)備數(shù)據(jù),生成所述設(shè)備類特征;
56、根據(jù)所述設(shè)備指標數(shù)據(jù)中包括的故障數(shù)量數(shù)據(jù),生成所述標簽。
57、在一種可能的實施方式中,所述第一特征處理模塊具體用于:
58、根據(jù)所述多個時間窗口和所述時間信息,對所述設(shè)備指標數(shù)據(jù)中包括的故障數(shù)量數(shù)據(jù)進行數(shù)據(jù)增強處理,得到所述故障數(shù)量類特征;
59、根據(jù)所述多個時間窗口和所述時間信息,對所述設(shè)備指標數(shù)據(jù)中包括的故障頻次數(shù)據(jù)進行數(shù)據(jù)增強處理,得到所述故障頻次類特征;
60、根據(jù)所述多個時間窗口和所述時間信息,對所述設(shè)備指標數(shù)據(jù)中包括的距離與拓撲類數(shù)據(jù)進行數(shù)據(jù)增強處理,得到所述距離與拓撲類類特征。
61、在一種可能的實施方式中,所述第二特征處理模塊具體用于:
62、對所述故障數(shù)量類特征、所述故障頻次類特征和所述故障時間類特征分別進行單特征選擇處理,依次得到對應(yīng)的目標數(shù)量特征、目標頻次特征和目標時間特征;
63、對所述目標數(shù)量特征、所述目標頻次特征、所述目標時間特征、所述距離與拓撲類特征和所述設(shè)備類特征進行多特征選擇處理,得到第一特征集合;
64、根據(jù)所述第一特征集合、所述距離與拓撲類特征和所述設(shè)備類特征,生成第一特征數(shù)據(jù)集、第二特征數(shù)據(jù)集和第三特征數(shù)據(jù)集,所述特征數(shù)據(jù)集包括所述第一特征數(shù)據(jù)集、所述第二特征數(shù)據(jù)集和所述第三特征數(shù)據(jù)集。
65、在一種可能的實施方式中,所述第二特征處理模塊具體用于:
66、對所述故障數(shù)量類特征、所述故障頻次類特征和所述故障時間類特征分別進行信息熵計算,得到所述故障數(shù)量類特征、所述故障頻次類特征和所述故障時間類特征各自的信息熵;
67、根據(jù)預(yù)設(shè)信息熵閾值和所述故障數(shù)量類特征的信息熵,對所述故障數(shù)量類特征進行篩選,得到所述目標數(shù)量特征;
68、根據(jù)所述預(yù)設(shè)信息熵閾值和所述故障頻次類特征的信息熵,對所述故障頻次類特征進行篩選,得到所述目標頻次特征;
69、根據(jù)所述預(yù)設(shè)信息熵閾值和所述故障時間類特征的信息熵,對所述故障時間類特征進行篩選,得到所述目標時間特征。
70、在一種可能的實施方式中,所述第二特征處理模塊具體用于:
71、對所述目標數(shù)量特征、所述目標頻次特征和所述目標時間特征進行卡方校驗處理,得到所述目標數(shù)量特征、所述目標頻次特征、所述目標時間特征之間的相關(guān)性;
72、根據(jù)所述相關(guān)性,以及所述故障數(shù)量類特征、所述故障頻次類特征和所述故障時間類特征各自的信息熵,對所述目標數(shù)量特征、所述目標頻次特征和所述目標時間特征進行篩選處理,得到篩選后的特征;
73、將所述篩選后的特征、所述距離與拓撲類特征和所述設(shè)備類特征進行合并處理,得到所述第一特征集合。
74、在一種可能的實施方式中,所述第二特征處理模塊具體用于:
75、對所述第一特征集合中的特征進行隨機抽樣處理,得到隨機抽樣特征;
76、對所述距離與拓撲類特征,和所述隨機抽樣特征進行去重處理和合并處理,得到所述第一特征數(shù)據(jù)集;
77、對所述設(shè)備類特征和所述隨機抽樣特征進行去重處理和合并處理,得到所述第二特征數(shù)據(jù)集;
78、根據(jù)所述隨機抽樣特征得到所述第三特征數(shù)據(jù)集。
79、在一種可能的實施方式中,所述故障預(yù)測模塊包括k最臨近子模型、支持向量機子模型和梯度提升樹子模型;所述輸入模塊具體用于:
80、將所述第一特征數(shù)據(jù)集輸入至所述k最臨近子模型,得到第一樣本預(yù)測結(jié)果;
81、將所述第二特征數(shù)據(jù)集輸入至所述支持向量機子模型,得到第二樣本預(yù)測結(jié)果;
82、將所述第三特征數(shù)據(jù)集輸入至所述梯度提升樹子模型,得到第三樣本預(yù)測結(jié)果;
83、對所述第一樣本預(yù)測結(jié)果、所述第二樣本預(yù)測結(jié)果和所述第三樣本預(yù)測結(jié)果進行加權(quán)處理,得到所述樣本預(yù)測結(jié)果。
84、第四方面,本技術(shù)提供一種故障預(yù)測裝置,包括:
85、第二獲取模塊,用于獲取目標網(wǎng)絡(luò)設(shè)備的目標設(shè)備指標數(shù)據(jù);
86、生成模塊,用于根據(jù)所述目標設(shè)備指標數(shù)據(jù),生成所述目標網(wǎng)絡(luò)設(shè)備的目標特征數(shù)據(jù)集;
87、處理模塊,用于將所述目標特征數(shù)據(jù)集輸入至故障預(yù)測模型,得到所述目標網(wǎng)絡(luò)設(shè)備的預(yù)測結(jié)果,所述預(yù)測結(jié)果用于指示所述目標網(wǎng)絡(luò)設(shè)備是否會發(fā)生故障,其中,所述故障預(yù)測模型為根據(jù)第一方面的故障預(yù)測模型訓(xùn)練方法訓(xùn)練得到的模型。
88、第五方面,本技術(shù)提供一種電子設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)如第一方面任一項所述的故障預(yù)測模型訓(xùn)練方法,或者,所述處理器執(zhí)行所述程序時實現(xiàn)如第二方面所述的故障預(yù)測方法。
89、本技術(shù)提供的故障預(yù)測模型訓(xùn)練方法、故障預(yù)測方法、裝置及設(shè)備,首先獲取預(yù)設(shè)時段內(nèi)、多個樣本網(wǎng)絡(luò)設(shè)備的設(shè)備指標數(shù)據(jù),根據(jù)設(shè)備指標數(shù)據(jù),得到多個樣本網(wǎng)絡(luò)設(shè)備的故障數(shù)量類特征、故障頻次類特征、故障時間類特征、距離與拓撲類特征、設(shè)備類特征,以及多個樣本網(wǎng)絡(luò)設(shè)備各自的標簽,標簽用于指示在預(yù)設(shè)時段內(nèi)對應(yīng)的樣本網(wǎng)絡(luò)設(shè)備是否發(fā)生故障;然后,對故障數(shù)量類特征、故障頻次類特征、故障時間類特征、距離與拓撲類特征和設(shè)備類特征進行分層特征選擇處理,得到特征數(shù)據(jù)集;進一步將特征數(shù)據(jù)集輸入至故障預(yù)測模型,得到故障預(yù)測模型輸出的樣本預(yù)測結(jié)果,樣本預(yù)測結(jié)果用于指示多個樣本網(wǎng)絡(luò)設(shè)備在預(yù)設(shè)時段內(nèi)發(fā)生故障的概率;根據(jù)樣本預(yù)測結(jié)果和所述標簽,對故障預(yù)測模型的參數(shù)進行調(diào)整。本技術(shù)的方案,無需人工進行故障預(yù)測,而是基于訓(xùn)練得到的故障預(yù)測模型來進行故障的預(yù)測,相較于人工預(yù)測的方式準確性更高。