日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種基于聚類(lèi)下采樣和可解釋深度森林的腦卒中預(yù)測(cè)方法

文檔序號(hào):39705627發(fā)布日期:2024-10-22 12:49閱讀:2來(lái)源:國(guó)知局
一種基于聚類(lèi)下采樣和可解釋深度森林的腦卒中預(yù)測(cè)方法

本涉及生物信息學(xué)中的疾病預(yù)測(cè),特別是在極度不平衡腦卒中數(shù)據(jù)的研究。該方法具體是一種結(jié)合了基于聚類(lèi)的下采樣方法和可解釋深度森林的預(yù)測(cè)方法,旨在根據(jù)醫(yī)療代謝指標(biāo)準(zhǔn)確預(yù)測(cè)腦卒中。


背景技術(shù):

1、中風(fēng)是供應(yīng)大腦的血管出現(xiàn)梗塞或者缺血的一系列病癥,中風(fēng)后,在受影響的腦部中心區(qū)域,細(xì)胞會(huì)在幾分鐘內(nèi)出現(xiàn)死亡,對(duì)大腦造成不可逆的傷害。盡管中風(fēng)如此危險(xiǎn),但引起中風(fēng)的代謝指標(biāo)卻是90%可控的,所以基于代謝指標(biāo)提前中風(fēng)是當(dāng)下最優(yōu)的解決方案。但在醫(yī)療數(shù)據(jù)中,存在著數(shù)據(jù)嚴(yán)重不平衡的問(wèn)題,會(huì)嚴(yán)重影響模型的性能。

2、近年來(lái),一些算法通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行重采樣獲取數(shù)據(jù)的均衡分布。如基于聚類(lèi)的重采樣方法cluster-based?undersample(cbu)、cluster-based?instance?selection(cbis)、undersample-cluster-oversample(uco)等,cbu算法采用的是對(duì)多數(shù)類(lèi)使用k-means聚類(lèi),再將根據(jù)每個(gè)質(zhì)心使用k-nn算法采樣對(duì)應(yīng)簇中樣本的方法實(shí)現(xiàn)不平衡數(shù)據(jù)的處理。而cbis算法使用ap算法代替k-means聚類(lèi),以節(jié)省認(rèn)為調(diào)整k值的時(shí)間,并使用選擇算法ga、ib3、drop3代替cbu的k-nn采樣步驟。而uco算法則使用隨機(jī)下采樣方法對(duì)多數(shù)類(lèi)實(shí)現(xiàn)下采樣,而使用k-means與smote的組合對(duì)少數(shù)類(lèi)進(jìn)行過(guò)采樣。研究的不斷發(fā)展,證明了基于聚類(lèi)的重采樣方法使得數(shù)據(jù)具有多樣性。同時(shí),許多研究論文的實(shí)驗(yàn)也說(shuō)明了集成的c4.5樹(shù)更適合不平衡數(shù)據(jù)集的建模和預(yù)測(cè)工作。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于解決極度不平衡數(shù)據(jù)下,提高腦卒中預(yù)測(cè)精度問(wèn)題。提出了一種新型的腦卒中預(yù)測(cè)方法cdf2s,其結(jié)合基于聚類(lèi)的重采樣算法cluster-based-undersample?-cluster(cbuc)和深度森林模型。cdf2s使用cbuc算法對(duì)將少數(shù)類(lèi)聚類(lèi)成k個(gè)簇,對(duì)每個(gè)簇中樣本劃分為訓(xùn)練集和測(cè)試集以提高訓(xùn)練樣本的多樣性、豐富性。從而提高模型的準(zhǔn)確率。

2、另外,為了使得模型的決策過(guò)程透明化,我們使用mean?decrease?impurity(mdi)方法計(jì)算輸入特征的gini不純度,對(duì)模型進(jìn)行了可解釋性分析。

3、以下是實(shí)現(xiàn)本發(fā)明目的的技術(shù)方案,包含如下步驟:

4、1.收集樣本數(shù)據(jù)?:獲取腦卒中和正常患者的代謝指標(biāo)以及分類(lèi)情況;

5、2.數(shù)據(jù)預(yù)處理:對(duì)特征進(jìn)行標(biāo)準(zhǔn)化,并對(duì)異常值進(jìn)行處理,獲取完整的、標(biāo)準(zhǔn)化數(shù)據(jù);

6、3.數(shù)據(jù)重采樣:使用提出的cbuc算法對(duì)不平衡數(shù)據(jù)重采樣,盡可能多地將多類(lèi)型的數(shù)據(jù)納入訓(xùn)練,得到一個(gè)平衡訓(xùn)練集;

7、4.構(gòu)建模型:使用級(jí)聯(lián)深度森林模型(df)對(duì)數(shù)據(jù)集進(jìn)行預(yù)測(cè);

8、5.模型優(yōu)化:?采用grid?search技術(shù)對(duì)預(yù)測(cè)的模型進(jìn)行優(yōu)化;

9、6.模型評(píng)估:采用10折交叉驗(yàn)證對(duì)模型的性能進(jìn)行評(píng)估,使用specificity(sp)、sensitivity(se)、gmean、area?under?the?curve(auc)以及accuracy(acc)五個(gè)指標(biāo)衡量模型性能;

10、7.模型解釋?zhuān)河?jì)算深度模型中第一層森林的mdi,對(duì)輸入的特征進(jìn)行重要性比較。



技術(shù)特征:

1.一種基于聚類(lèi)下采樣和可解釋深度森林的腦卒中預(yù)測(cè)方法cdf2s,其過(guò)程包含如下步驟:

2.該方法將極度不平衡腦卒中數(shù)據(jù)重采樣為平衡數(shù)據(jù)集,提高模型的預(yù)測(cè)精度,同時(shí)兼具可解釋性,相比于最先進(jìn)的方法具有更優(yōu)越的識(shí)別性能且預(yù)測(cè)過(guò)程更加透明。

3.根據(jù)權(quán)利要求1所述的一種基于聚類(lèi)下采樣和可解釋深度森林的腦卒中預(yù)測(cè)方法,其特征在于,步驟3)和步驟7)中所述的cbuc算法重采樣和模型解釋?zhuān)@得高性能預(yù)測(cè)模型的同時(shí),還可以對(duì)預(yù)測(cè)模型進(jìn)行解釋?zhuān)诡A(yù)測(cè)過(guò)程更加透明。


技術(shù)總結(jié)
本發(fā)明公開(kāi)了一種基于聚類(lèi)下采樣和可解釋深度森林的腦卒中預(yù)測(cè)方法,獲取腦卒中和正?;颊叩拇x指標(biāo)以及分類(lèi)情況;對(duì)特征進(jìn)行標(biāo)準(zhǔn)化,并對(duì)異常值進(jìn)行處理,獲取完整的、標(biāo)準(zhǔn)化數(shù)據(jù);使用提出的CBUC算法對(duì)不平衡數(shù)據(jù)重采樣,盡可能多地將多類(lèi)型的數(shù)據(jù)納入訓(xùn)練,得到一個(gè)平衡訓(xùn)練集;使用級(jí)聯(lián)深度森林模型(DF)對(duì)數(shù)據(jù)集進(jìn)行預(yù)測(cè);采用Grid?search技術(shù)對(duì)預(yù)測(cè)的模型進(jìn)行優(yōu)化;采用10折交叉驗(yàn)證對(duì)模型的性能進(jìn)行評(píng)估,使用Specificity(SP)、Sensitivity(SE)、Gmean、Area?Under?the?Curve(AUC)以及Accuracy(ACC)五個(gè)指標(biāo)衡量模型性能;計(jì)算深度模型中第一層森林的MDI,對(duì)輸入的特征進(jìn)行重要性比較。該方法將極度不平衡腦卒中數(shù)據(jù)重采樣為平衡數(shù)據(jù)集,提高模型的預(yù)測(cè)精度,同時(shí)兼具可解釋性,相比于最先進(jìn)的方法具有更優(yōu)越的識(shí)別性能且預(yù)測(cè)過(guò)程更加透明。

技術(shù)研發(fā)人員:樊永顯,李雪萍,孫貴聰,劉夢(mèng),潘應(yīng)捷,鄭夢(mèng)鑫,王晨,郭智
受保護(hù)的技術(shù)使用者:桂林電子科技大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1