一種基于分解-聚合策略的卷煙感官智能評估系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)挖掘及專家評吸領(lǐng)域,具體涉及一種基于分解-聚合策略的卷煙 感官智能評估系統(tǒng)
【背景技術(shù)】
[0002] 在卷煙生產(chǎn)過程中,很難針對煙草的物理化學(xué)指標(biāo)與卷煙的感官質(zhì)量的復(fù)雜關(guān)系 建立起有效的數(shù)學(xué)模型,因此在煙草及其制品的新產(chǎn)品開發(fā)和產(chǎn)品維護(hù)過程中,主要通過 品煙專家的人工感官評吸對卷煙產(chǎn)品感官質(zhì)量指標(biāo)進(jìn)行評價(jià)。顯然,這種完全依賴人工反 復(fù)評吸的生產(chǎn)方式會極大地影響評價(jià)結(jié)果的效率性,無法滿足企業(yè)對生產(chǎn)快速性的要求。
[0003] 為了解決評吸過程中主觀性強(qiáng)、效率低下的問題,學(xué)者們開始使用數(shù)據(jù)挖掘的方 法來對卷煙感官質(zhì)量進(jìn)行評價(jià),力求從大量煙草數(shù)據(jù)中提取出物理化學(xué)指標(biāo)和感官質(zhì)量的 映射規(guī)則,以輔助或代替品煙專家完成對卷煙的感官預(yù)測評價(jià)。當(dāng)前主要以BP神經(jīng)網(wǎng)絡(luò)方 法或支持向量機(jī)方法來解決成品卷煙的智能化感官評估問題。
[0004] 然而,卷煙感官評估歷史數(shù)據(jù)復(fù)雜,卷煙感官質(zhì)量具有多個(gè)類別,涉及多分類問 題,而現(xiàn)有的分類器在處理多分類問題時(shí)往往不能獲得預(yù)期的效果。將多分類問題分解成 一對一的兩分類問題是數(shù)據(jù)挖掘領(lǐng)域針對解決多分類問題的有效途徑。因此,本發(fā)明利用 數(shù)據(jù)挖掘技術(shù)結(jié)合卷煙感官評估實(shí)踐,將卷煙智能感官評估中涉及的多分類問題分解成多 個(gè)便于建模的兩分類問題,然后對每個(gè)子問題分別建立分類器,接著采用聚合策略將兩類 分類器組合成多分類器。具體地,本發(fā)明采用三種不同的分類器建立兩分類模型,包括決策 樹,神經(jīng)網(wǎng)絡(luò)和支持向量機(jī);采用多種聚合策略組合兩類分類器,包括投票法,加權(quán)投票法, 學(xué)習(xí)權(quán)值偏好法,非支配準(zhǔn)則,基于距離加權(quán)法以及動態(tài)搜索法。該發(fā)明的創(chuàng)新點(diǎn)可以歸納 為以下幾點(diǎn):
[0005] (1)本發(fā)明將卷煙智能感官評估中涉及的多分類問題分解成多個(gè)便于建模的兩分 類子問題,可以有效解決多分類問題模型復(fù)雜,難于求解的問題;
[0006] (2)本發(fā)明采用多種聚合策略組合兩類分類器,從而建立多分類器。
[0007] (3)本發(fā)明設(shè)計(jì)了完整的實(shí)驗(yàn)來驗(yàn)證該策略的有效性。
[0008] 實(shí)驗(yàn)結(jié)果表明,相比較于經(jīng)典的多分類器,采用本發(fā)明的策略,不管采用何種基本 分類器,其預(yù)測精度都明顯高于經(jīng)典的多分類器。因此,運(yùn)用本發(fā)明的系統(tǒng),可以為卷煙企 業(yè)在新產(chǎn)品的開發(fā)和產(chǎn)品維護(hù)過程中,輔助卷煙感官評估專家進(jìn)行卷煙感官評估。
【發(fā)明內(nèi)容】
[0009] 針對現(xiàn)有研究和實(shí)際應(yīng)用中存在的問題,本發(fā)明設(shè)計(jì)了一種基于分解-聚合策略 的卷煙感官智能評估系統(tǒng)
[0010]本發(fā)明的技術(shù)方案是:
[0011] 基于分解-聚合策略的卷煙感官智能評估系統(tǒng),具體包括以下步驟:
[0012] 步驟1:采集成品煙感官待評估數(shù)據(jù),即卷煙化學(xué)成分指標(biāo);
[0013] 卷煙化學(xué)成分指標(biāo)包括:總糖量、還原糖、煙堿量、總揮發(fā)堿、總氮量、煙堿氮、蛋白 質(zhì)、施木克值、氮堿比、含氯量、含鉀量、糖堿比、氨態(tài)堿;
[0014] 步驟2:對成品卷煙的感官評估結(jié)果進(jìn)行離散化處理,獲得卷煙感官質(zhì)量的分類問 題數(shù)據(jù)集;
[0015] 步驟3:利用基于分解-聚合的多分類方法建立卷煙感官質(zhì)量評估模型;
[0016] 所述基于分解-聚類的多分類方法建立的卷煙感官質(zhì)量評估模型為:根據(jù)成品煙 感官評估的歷史數(shù)據(jù),根據(jù)感官指標(biāo)的數(shù)據(jù)特點(diǎn)(類別數(shù))獲得多個(gè)成對的兩分類問題,再 針對每個(gè)子問題,利用數(shù)據(jù)挖掘技術(shù)建立分類器,最后采用聚合方法將子分類器組合成多 分類器;
[0017] 所述感官質(zhì)量指標(biāo)包括:光澤、香氣、雜氣、刺激、余味;
[0018] 步驟4:得到卷煙感官質(zhì)量評估結(jié)果。
[0019] 針對未知樣本,每個(gè)分類器給出預(yù)測結(jié)果,獲得分值表,然后采用聚合策略將兩分 類器組合成多分類器,輸出預(yù)測結(jié)果,本發(fā)明采用的聚合策略包括Vote,WV,LVPC,ND,DRCW 和 DCS;
[0020] 本發(fā)明的有益效果如下:
[0021] 本發(fā)明基于分解-聚合的多分類方法預(yù)測卷煙感官質(zhì)量,幫助煙草企業(yè)建立智能 感官評估系統(tǒng)。對于卷煙設(shè)計(jì)專家,可以利用本發(fā)明的方法,將卷煙配方的物化指標(biāo)作為模 型的輸入變量,模型將自動輸出卷煙各個(gè)感官指標(biāo)的分值,可以較高精度地預(yù)測卷煙的感 官質(zhì)量,幫助卷煙設(shè)計(jì)專家在卷煙產(chǎn)品的開發(fā)和設(shè)計(jì)中進(jìn)行更好的決策。
[0022] 本發(fā)明所提的分解-聚合策略能夠有效地處理智能感官評吸中多分類問題。相比 較于基本的分類器,分解-聚合策略能夠取得更好的預(yù)測精度,因此該方法可以幫助煙草企 業(yè)在進(jìn)行智能感官評估中提高工作效率,幫助煙草企業(yè)科學(xué)高效地進(jìn)行產(chǎn)品維護(hù)和新產(chǎn)品 開發(fā)。
【附圖說明】
[0023]圖1是本發(fā)明中【具體實(shí)施方式】的分解策略的示例圖 [0024]圖2是本發(fā)明中實(shí)驗(yàn)驗(yàn)證中各感官指標(biāo)值分布情況 [0025]圖3是本發(fā)明中實(shí)驗(yàn)驗(yàn)證中效果比較圖(CART)
[0026]圖4是本發(fā)明中實(shí)驗(yàn)驗(yàn)證中效果比較圖(BPNN)
[0027]圖5是本發(fā)明中實(shí)驗(yàn)驗(yàn)證中效果比較圖(SVM)
【具體實(shí)施方式】
[0028] 下面結(jié)合附圖對本發(fā)明的【具體實(shí)施方式】做詳細(xì)說明。
[0029] 根據(jù)成品煙感官評估的工藝要求和質(zhì)量要求,本實(shí)施方式基于總糖量、還原糖、煙 堿量、總揮發(fā)堿、總氮量、煙堿氮、蛋白質(zhì)、施木克值、氮堿比、含氯量、含鉀量、糖堿比、和氨 態(tài)堿這13種物理化學(xué)指標(biāo)作為輸入變量;基于光澤、香氣、雜氣、刺激、余味五種感官評吸指 標(biāo)作為輸出變量建立基于分解-聚合的多分類方法的卷煙感官質(zhì)量評估模型并進(jìn)行了實(shí)驗(yàn) 驗(yàn)證。
[0030] 本實(shí)施方式建立基于分解-聚合策略的卷煙感官智能評估系統(tǒng),包括如下步驟:
[0031] 步驟1:采集成品煙感官待評估數(shù)據(jù),即卷煙物化指標(biāo)數(shù)據(jù)和相應(yīng)的感官指標(biāo)數(shù) 據(jù);
[0032] 卷煙物化指標(biāo)包括:總糖量、還原糖、煙堿量、總揮發(fā)堿、總氮量、煙堿氮、蛋白質(zhì)、 施木克值、氮堿比、含氯量、含鉀量、糖堿比、氨態(tài)堿;感官指標(biāo)包括:光澤、香氣、雜氣、刺激、 余味;
[0033]步驟2:對歷史數(shù)據(jù)進(jìn)行預(yù)處理,包括輸入變量的歸一化處理和輸出變量的離散化 處理;
[0034] 步驟3:利用基于分解-聚合的多分類方法建立卷煙感官質(zhì)量評估模型;
[0035] 所述基于分解-聚類的多分類方法建立的卷煙感官質(zhì)量評估模型為:根據(jù)成品煙 感官評估的歷史數(shù)據(jù),根據(jù)感官指標(biāo)的數(shù)據(jù)特點(diǎn)(類別數(shù))獲得多個(gè)成對的兩分類問題,再 針對每個(gè)子問題,利用數(shù)據(jù)挖掘技術(shù)建立分類器,最后采用聚合方法將子分類器組合成多 分類器;
[0036] 所述感官質(zhì)量指標(biāo)包括:光澤、香氣、雜氣、刺激、余味;
[0037] 所述的基于分解-聚合的多分類方法建立卷煙感官質(zhì)量評估模型按如下步驟建 立:
[0038] 步驟3-1:采集成品煙感官評估的歷史數(shù)據(jù),建立卷煙感官質(zhì)量評估訓(xùn)練數(shù)據(jù)樣本 集;
[0039] 卷煙感官質(zhì)量評估訓(xùn)練數(shù)據(jù)樣本集包括卷煙化學(xué)成分指標(biāo)和感官評吸指標(biāo)的專 家評分結(jié)果;
[0040] 所述卷煙感官質(zhì)量評估數(shù)據(jù)樣本集中的感官評吸指標(biāo)的專家評分結(jié)果是由多個(gè) 專家打分后求平均值得到的。
[0041] 收集來自煙草企業(yè)的卷煙專家人工感官評估的成品煙感官評估的歷史數(shù)據(jù)以建 立進(jìn)行分類預(yù)測的卷煙感官質(zhì)量評估訓(xùn)練數(shù)據(jù)樣本集,對歷史數(shù)據(jù)進(jìn)行整理,刪除一些重 復(fù)的或是存在缺失的數(shù)據(jù),最后所得到的每一組歷史數(shù)據(jù)均包括13種化學(xué)成分指標(biāo)和5種 感官評吸指標(biāo),本實(shí)施方式的卷煙感官質(zhì)量評估訓(xùn)練數(shù)據(jù)樣本集中包括某煙草企業(yè)2010~ 2012三年的成品煙數(shù)據(jù),共計(jì)684組數(shù)據(jù)。
[0042] 數(shù)據(jù)均通過多個(gè)專家打分后求平均值得到的,每一項(xiàng)指標(biāo)分別作為分類使用的決 策屬性,根據(jù)六組不同項(xiàng)目進(jìn)行六組不同實(shí)驗(yàn)。專家打分依據(jù)的感官質(zhì)量評判標(biāo)準(zhǔn)如表1所 不。