圖像類別的確定方法、裝置及存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：11231294閱讀：1156來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本公開涉及圖像處理領(lǐng)域，尤其涉及一種圖像類別的確定方法、裝置及存儲(chǔ)介質(zhì)。

背景技術(shù)：

在相關(guān)技術(shù)中，深度卷積神經(jīng)網(wǎng)絡(luò)(英文：convolutionneuralnetworks簡(jiǎn)稱：cnn)被經(jīng)常使用于圖像識(shí)別中，能夠支持對(duì)圖像的單標(biāo)簽的分類，例如，對(duì)于1000個(gè)類別的分類問(wèn)題，通過(guò)目前的cnn對(duì)圖像進(jìn)行識(shí)別，輸出結(jié)果為一個(gè)1000維的概率向量，用于表示對(duì)應(yīng)的1000個(gè)類別中每一個(gè)類別的置信度，這1000個(gè)類別的置信度之和為1，其中置信度最高的類別就是該待識(shí)別圖像的類別標(biāo)簽，也就是說(shuō)利用該cnn只能從這1000個(gè)類別中確定該圖像的一個(gè)類別標(biāo)簽。

技術(shù)實(shí)現(xiàn)要素：

為克服相關(guān)技術(shù)中存在的問(wèn)題，本公開提供一種圖像類別的確定方法、裝置及存儲(chǔ)介質(zhì)。

根據(jù)本公開實(shí)施例的第一方面，提供一種圖像類別的確定方法，包括：

獲取目標(biāo)圖像的圖像數(shù)據(jù)；

通過(guò)后向傳遞算法確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)，所述深度卷積神經(jīng)網(wǎng)絡(luò)用于對(duì)所述圖像數(shù)據(jù)進(jìn)行識(shí)別；

在確定所述深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)后，將所述圖像數(shù)據(jù)作為所述深度卷積神經(jīng)網(wǎng)絡(luò)輸入，獲取所述深度卷積神經(jīng)網(wǎng)絡(luò)輸出的預(yù)設(shè)個(gè)數(shù)的二分類概率，其中，每個(gè)所述二分類概率對(duì)應(yīng)一個(gè)類別，且每個(gè)所述二分類概率互不相關(guān)；

根據(jù)所有的所述二分類概率確定所述目標(biāo)圖像的類別。

可選的，所述深度卷積神經(jīng)網(wǎng)絡(luò)，包括：二維神經(jīng)元全連接層，至少一個(gè)一維神經(jīng)元全連接層和至少一個(gè)卷積層，其中，所述二維神經(jīng)元全連接層位于所述至少一個(gè)一維神經(jīng)元全連接層的下層，所述至少一個(gè)一維神經(jīng)元全連接層位于所述至少一個(gè)卷積層的下層。

可選的，所述通過(guò)后向傳遞算法確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)，包括：

分別對(duì)所述深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)建立臨時(shí)存儲(chǔ)器；

利用為所述深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)建立的臨時(shí)存儲(chǔ)器，通過(guò)所述后向傳遞算法訓(xùn)練所述深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)；

其中，當(dāng)所述深度卷積神經(jīng)網(wǎng)絡(luò)中的所有層執(zhí)行一次所述訓(xùn)練所述深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟后，再次執(zhí)行所述訓(xùn)練所述深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟，直至所述深度卷積神經(jīng)網(wǎng)絡(luò)中每層的每個(gè)參數(shù)的梯度值滿足預(yù)設(shè)的收斂條件時(shí)，將所述深度卷積神經(jīng)網(wǎng)絡(luò)中每層的每個(gè)參數(shù)的當(dāng)前值確定為所述深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)。

可選的，所述訓(xùn)練所述深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟包括：

在所述深度卷積神經(jīng)網(wǎng)絡(luò)的當(dāng)前層不存在下一層時(shí)，將所述當(dāng)前層的每個(gè)參數(shù)，分別與所述當(dāng)前層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值相加，得到所述當(dāng)前層的更新后的參數(shù)；其中，每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值是在上次執(zhí)行所述訓(xùn)練所述深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟時(shí)得到的，所述深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值的初始值為零；

獲取所述當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值；

將所述當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值存儲(chǔ)在與所述當(dāng)前層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中。

可選的，所述訓(xùn)練所述深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟包括：

在所述深度卷積神經(jīng)網(wǎng)絡(luò)的當(dāng)前層存在下一層時(shí)，將所述當(dāng)前層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值，分別與所述下一層的臨時(shí)存儲(chǔ)器中存儲(chǔ)的與所述當(dāng)前層的每個(gè)參數(shù)關(guān)聯(lián)的參數(shù)的梯度值相加，得到所述當(dāng)前層的每個(gè)參數(shù)的新的梯度值；其中，每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值是在上次執(zhí)行所述訓(xùn)練所述深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟時(shí)得到的，所述深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值的初始值為零；

將所述當(dāng)前層的每個(gè)參數(shù)的新的梯度值，分別與所述當(dāng)前層的每個(gè)參數(shù)相加，得到所述當(dāng)前層的更新后的參數(shù)；

獲取所述當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值；

將所述當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值存儲(chǔ)在與所述當(dāng)前層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中；

其中，所述當(dāng)前層和所述下一層為所述深度卷積神經(jīng)網(wǎng)絡(luò)中任意相鄰的兩層。

可選的，所述二分類概率包括，肯定概率值和否定概率值，所述肯定概率值是所述圖像屬于所述二分類概率對(duì)應(yīng)分類的概率值，所述根據(jù)所有的所述二分類概率確定所述目標(biāo)圖像的類別，包括：

將所述所有的所述二分類概率中所述肯定概率值大于預(yù)設(shè)概率閾值的所述二分類概率，確定為目標(biāo)二分類概率；

將所有所述目標(biāo)二分類概率所對(duì)應(yīng)類別確定為所述目標(biāo)圖像的類別。

可選的，所述二維神經(jīng)元全連接層包括利用邏輯回歸函數(shù)確定的預(yù)設(shè)個(gè)數(shù)的二維神經(jīng)元。

根據(jù)本公開實(shí)施例的第二方面，提供一種圖像類別的確定裝置，包括：

圖像數(shù)據(jù)獲取模塊，被配置為獲取目標(biāo)圖像的圖像數(shù)據(jù)；

圖像數(shù)據(jù)識(shí)別模塊，被配置為通過(guò)后向傳遞算法確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)，所述深度卷積神經(jīng)網(wǎng)絡(luò)用于對(duì)所述圖像數(shù)據(jù)進(jìn)行識(shí)別；

二分類概率輸出模塊，被配置為在確定所述深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)后，將所述圖像數(shù)據(jù)作為所述深度卷積神經(jīng)網(wǎng)絡(luò)輸入，獲取所述深度卷積神經(jīng)網(wǎng)絡(luò)輸出的預(yù)設(shè)個(gè)數(shù)的二分類概率，其中，每個(gè)所述二分類概率對(duì)應(yīng)一個(gè)類別，且每個(gè)所述二分類概率互不相關(guān)；

圖像類別確定模塊，被配置為根據(jù)所有的所述二分類概率確定所述目標(biāo)圖像的類別。

可選的，所述圖像數(shù)據(jù)識(shí)別模塊，包括存儲(chǔ)器建立子模塊和參數(shù)訓(xùn)練子模塊：

所述存儲(chǔ)器建立子模塊，被配置為分別對(duì)所述深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)建立臨時(shí)存儲(chǔ)器；

所述參數(shù)訓(xùn)練子模塊，被配置為利用為所述深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)建立的臨時(shí)存儲(chǔ)器，通過(guò)所述后向傳遞算法訓(xùn)練所述深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)；

可選的，所述參數(shù)訓(xùn)練子模塊，被配置為：

獲取所述當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值；

可選的，所述參數(shù)訓(xùn)練子模塊，被配置為：

將所述當(dāng)前層的每個(gè)參數(shù)的新的梯度值，分別與所述當(dāng)前層的每個(gè)參數(shù)相加，得到所述當(dāng)前層的更新后的參數(shù)；

獲取所述當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值；

其中，所述當(dāng)前層和所述下一層為所述深度卷積神經(jīng)網(wǎng)絡(luò)中任意相鄰的兩層。

可選的，所述二分類概率包括，肯定概率值和否定概率值，所述肯定概率值是所述圖像屬于所述二分類概率對(duì)應(yīng)分類的概率值；所述圖像類別確定模塊，包括：

二分類概率識(shí)別子模塊，被配置為將所述所有的所述二分類概率中所述肯定概率值大于預(yù)設(shè)概率閾值的所述二分類概率，確定為目標(biāo)二分類概率；

圖像類別確定子模塊，被配置為將所有所述目標(biāo)二分類概率所對(duì)應(yīng)類別確定為所述目標(biāo)圖像的類別。

可選的，所述二維神經(jīng)元全連接層包括利用邏輯回歸函數(shù)確定的預(yù)設(shè)個(gè)數(shù)的二維神經(jīng)元。

根據(jù)本公開實(shí)施例的第三方面，提供一種圖像類別的確定裝置，所述裝置包括：

處理器；

用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器；

其中，所述處理器被配置為：獲取目標(biāo)圖像的圖像數(shù)據(jù)；通過(guò)后向傳遞算法確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)，所述深度卷積神經(jīng)網(wǎng)絡(luò)用于對(duì)所述圖像數(shù)據(jù)進(jìn)行識(shí)別；在確定所述深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)后，將所述圖像數(shù)據(jù)作為所述深度卷積神經(jīng)網(wǎng)絡(luò)輸入，獲取所述深度卷積神經(jīng)網(wǎng)絡(luò)輸出的預(yù)設(shè)個(gè)數(shù)的二分類概率，其中，每個(gè)所述二分類概率對(duì)應(yīng)一個(gè)類別，且每個(gè)所述二分類概率互不相關(guān)；根據(jù)所有的所述二分類概率確定所述目標(biāo)圖像的類別。

根據(jù)本公開實(shí)施例的第四方面，提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，當(dāng)所述存儲(chǔ)介質(zhì)中的計(jì)算機(jī)程序指令由處理器執(zhí)行時(shí)，能夠?qū)崿F(xiàn)第一方面所述方法的步驟。

本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果：

上述技術(shù)方案在獲取目標(biāo)圖像的圖像數(shù)據(jù)后，通過(guò)后向傳遞算法確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)，所述深度卷積神經(jīng)網(wǎng)絡(luò)用于對(duì)所述圖像數(shù)據(jù)進(jìn)行識(shí)別，在確定所述深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)后，將所述圖像數(shù)據(jù)作為所述深度卷積神經(jīng)網(wǎng)絡(luò)輸入，獲取所述深度卷積神經(jīng)網(wǎng)絡(luò)輸出的預(yù)設(shè)個(gè)數(shù)的二分類概率，其中，每個(gè)所述二分類概率對(duì)應(yīng)一個(gè)類別，且每個(gè)所述二分類概率互不相關(guān)，并根據(jù)所有的所述二分類概率確定所述目標(biāo)圖像的類別。本公開所提供的技術(shù)方案通過(guò)改進(jìn)深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)，使得深度卷積神經(jīng)網(wǎng)絡(luò)輸出互不相關(guān)的二分類概率，能夠?qū)崿F(xiàn)對(duì)圖像的多標(biāo)簽分類。

應(yīng)當(dāng)理解的是，以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的，并不能限制本公開。

附圖說(shuō)明

此處的附圖被并入說(shuō)明書中并構(gòu)成本說(shuō)明書的一部分，示出了符合本公開的實(shí)施例，并與說(shuō)明書一起用于解釋本公開的原理。

圖1是相關(guān)技術(shù)中的基于alexnet網(wǎng)絡(luò)結(jié)構(gòu)的cnn的結(jié)構(gòu)示意圖；

圖2是根據(jù)一示例性實(shí)施例示出一種基于alexnet網(wǎng)絡(luò)結(jié)構(gòu)的cnn的結(jié)構(gòu)示意圖；

圖3是根據(jù)一示例性實(shí)施例示出的一種圖像類別的確定方法的流程圖；

圖4是根據(jù)一示例性實(shí)施例示出的一種圖像類別的確定方法的流程圖；

圖5是根據(jù)一示例性實(shí)施例示出的一種圖像類別的確定方法的流程圖；

圖6是根據(jù)一示例性實(shí)施例示出的一種圖像類別的確定方法的流程圖；

圖7是根據(jù)一示例性實(shí)施例示出的一種圖像類別的確定裝置的框圖；

圖8是根據(jù)一示例性實(shí)施例示出的一種圖像數(shù)據(jù)識(shí)別模塊的框圖；

圖9是根據(jù)一示例性實(shí)施例示出的一種圖像類別確定模塊的框圖；

圖10是根據(jù)另一示例性實(shí)施例示出的一種圖像類別的確定裝置的框圖。

具體實(shí)施方式

這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說(shuō)明，其示例表示在附圖中。下面的描述涉及附圖時(shí)，除非另有表示，不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開相一致的所有實(shí)施方式。相反，它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。

在介紹本公開的實(shí)施例之前，首先對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行介紹。

在本公開實(shí)施例中，涉及的cnn結(jié)構(gòu)，可以基于alexnet網(wǎng)絡(luò)結(jié)構(gòu)，在基于該結(jié)構(gòu)的cnn中，圖像數(shù)據(jù)會(huì)分別經(jīng)過(guò)一系列的卷積層(英文：convolutionlayer)、激活層(英文：activationlayer)、池化層(英文：poolinglayer)、全連接層(英文：fullyconnectedlayer)的處理，并通過(guò)類別概率層(英文：softmaxlayer)進(jìn)行結(jié)果的輸出。采用cnn進(jìn)行圖像數(shù)據(jù)的識(shí)別能夠獲取對(duì)平移、縮放和旋轉(zhuǎn)不變的觀測(cè)數(shù)據(jù)的顯著特征，圖像數(shù)據(jù)的局部感受區(qū)域允許神經(jīng)元(或者處理單元)訪問(wèn)到基礎(chǔ)的圖像特征，例如定向邊緣或者角點(diǎn)。但是相關(guān)技術(shù)中的cnn只支持單標(biāo)簽分類，并不支持多標(biāo)簽分類，即可以理解為只能識(shí)別出圖像的一個(gè)分類，因此對(duì)于包括多個(gè)類別對(duì)象的圖像也只能識(shí)別出其中的一個(gè)類別。例如，在一幅圖像中同時(shí)出現(xiàn)了貓和狗，當(dāng)相關(guān)技術(shù)中的cnn對(duì)圖像進(jìn)行識(shí)別后所輸出的識(shí)別結(jié)果中，貓和狗的置信度是此消彼長(zhǎng)的關(guān)系，即其識(shí)別結(jié)果非貓即狗，無(wú)法實(shí)現(xiàn)在同一圖像中對(duì)多個(gè)類別的對(duì)象的識(shí)別。

因此，本公開實(shí)施例所提出的cnn的網(wǎng)絡(luò)結(jié)構(gòu)是基于alexnet的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行的改進(jìn)。alexnet是最初應(yīng)用于大規(guī)模圖像識(shí)別并取得積極結(jié)果的深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)，相關(guān)技術(shù)中alexnet網(wǎng)絡(luò)結(jié)構(gòu)包括8層，如圖1所示。其中第一層到第五層是卷積層，以第一層為例，當(dāng)輸入的圖像規(guī)格采用224*224*3時(shí)，第一層的卷積濾波器的大小是11*11，卷積步幅設(shè)置為4，包括96個(gè)卷積濾波器，因此該第一層的輸出是96個(gè)55*55大小的圖像，在卷積濾波之后還可以接有relus(英文：rectifiedlinearunits，中文：激活函數(shù))操作和最大池化(英文：max-pooling)處理操作，用于提高深度卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度以及提高訓(xùn)練的經(jīng)度，不容易產(chǎn)生過(guò)擬合的訓(xùn)練結(jié)果。從第一層到第五層，每層設(shè)置有不同大小和個(gè)數(shù)的濾波器，如圖1所示，第二層的卷積濾波器的大小是5*5，設(shè)置有256個(gè)卷積濾波器，第三層和第四層的卷積濾波器的大小是3*3，設(shè)置有384個(gè)卷積濾波器，第五層的的卷積濾波器的大小是3*3，設(shè)置有256個(gè)卷積濾波器，通過(guò)對(duì)輸入圖像數(shù)據(jù)進(jìn)行逐層的卷積處理，其處理過(guò)程與上述的第一層相同，最終輸出256個(gè)6*6的特征圖像。之后第六層到第八層是全連接層，是在前五層卷積層的基礎(chǔ)上再加上一個(gè)三層的全連接神經(jīng)網(wǎng)絡(luò)分類器。以第六層為例，該第六層的神經(jīng)元個(gè)數(shù)為4096個(gè)，用于對(duì)第五層輸出的256個(gè)大小為6*6特征圖像進(jìn)行一個(gè)全連接處理以將上述256個(gè)特征圖像進(jìn)行卷積變?yōu)橐粋€(gè)特征點(diǎn)，然后對(duì)于4096個(gè)神經(jīng)元中的每一個(gè)神經(jīng)元，都是由256個(gè)特征圖中某些個(gè)特征圖卷積之后得到的特征點(diǎn)乘以相應(yīng)的權(quán)重之后，再加上一個(gè)偏置得到的。而第八層的神經(jīng)元個(gè)數(shù)設(shè)置為1000(個(gè)數(shù)可以根據(jù)需要設(shè)置)，用于訓(xùn)練目標(biāo)圖像的1000個(gè)類別，因此第八層最終的輸出結(jié)果為一個(gè)1000維的概率向量，該概率向量中的每個(gè)元素用于表示上述1000個(gè)類別中的每一個(gè)類別的置信度，這1000個(gè)類別的置信度的和為1，置信度最高的類別就是該目標(biāo)圖像的類別。

在本公開一實(shí)施例中，cnn的結(jié)構(gòu)如圖2所示，其與相關(guān)技術(shù)中的cnn的結(jié)構(gòu)不同之處在于，在第八層使用1000個(gè)(二維神經(jīng)元的數(shù)量可以根據(jù)實(shí)際需要來(lái)設(shè)置)互不影響的二維神經(jīng)元代替原來(lái)的一維神經(jīng)元，其中，每個(gè)二維神經(jīng)元對(duì)應(yīng)一個(gè)類別。舉例來(lái)說(shuō)，在本公開一實(shí)施例中，cnn網(wǎng)絡(luò)的輸出表示為output，output＝[c_1，c_2，…，c_k]，其中，k＝1000，其中c_1，c_2，…，c_k分別表示上述1000個(gè)二維神經(jīng)元輸出的二分類概率，c_i表示第i個(gè)類別的二分類概率的編號(hào)，因?yàn)槎S神經(jīng)元輸出的是二分類概率，因此c_i包括：c_i＝0和c_i＝1，其中c_i＝0用于表示待識(shí)別的樣本圖像不屬于該c_i對(duì)應(yīng)的類別，c_i＝1則表示這幅圖像屬于該c_i對(duì)應(yīng)類別，所有的c_i的概率值相加和不等于1，且c_i＝0和c_i＝1的概率之和等于1。為了實(shí)現(xiàn)這一目的，在本公開一實(shí)施例提供的cnn的輸出不再是一個(gè)k維的概率向量，而是k個(gè)不相互干擾的二維概率向量，從而能夠?qū)D像進(jìn)行k個(gè)分類的識(shí)別，因此能夠?qū)崿F(xiàn)圖像的多標(biāo)簽分類。

圖3是根據(jù)一示例性實(shí)施例示出的一種圖像類別的確定方法的流程圖，如圖3所示，該方法包括以下步驟：

在步驟301中，獲取目標(biāo)圖像的圖像數(shù)據(jù)。

在步驟302中，通過(guò)后向傳遞算法確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)，該深度卷積神經(jīng)網(wǎng)絡(luò)用于對(duì)圖像數(shù)據(jù)進(jìn)行識(shí)別。

示例地，該深度卷積神經(jīng)網(wǎng)絡(luò)包括：二維神經(jīng)元全連接層，至少一個(gè)一維神經(jīng)元全連接層和至少一個(gè)卷積層，其中，二維神經(jīng)元全連接層位于至少一個(gè)一維神經(jīng)元全連接層的下層，至少一個(gè)一維神經(jīng)元全連接層位于至少一個(gè)卷積層的下層。也就是說(shuō)，該深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)從上至下，依次是卷積層，一維神經(jīng)元全連接層和二維神經(jīng)元全連接層，示例地，卷積層的層數(shù)可以為5，一維神經(jīng)元全連接層的層數(shù)可以為2，該深度卷積神經(jīng)網(wǎng)絡(luò)的最后一層為二維神經(jīng)元全連接層，其結(jié)構(gòu)可以如圖2所示。

其中，后向傳遞算法(英文：back-propagation，簡(jiǎn)稱bp)是一種神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法，是在多層前饋神經(jīng)網(wǎng)絡(luò)上的學(xué)習(xí)，它能夠迭代地處理訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)中的數(shù)據(jù)集(參數(shù)和參數(shù)的梯度的集合)，直至滿足預(yù)設(shè)的收斂條件。簡(jiǎn)單的說(shuō)，就是從最后一層即輸出層開始，經(jīng)由各個(gè)全連接層和卷積層到第一層為止，逐層向前訓(xùn)練各層的每個(gè)參數(shù)，依次求出每層的每個(gè)參數(shù)的梯度值，求出的梯度值可以用于對(duì)每層以及每層的上一層的參數(shù)更新，因此稱作后向傳遞，在所有層的參數(shù)更新過(guò)一次后再次執(zhí)行上述方法，直至每層的每個(gè)參數(shù)的梯度滿足收斂條件為止，因此也可以看做是一種逐層求梯度值的算法。

另外，步驟302和步驟301沒有固定的執(zhí)行順序，也可以先執(zhí)行步驟302，再執(zhí)行步驟301。

在步驟303中，在確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)后，將圖像數(shù)據(jù)作為深度卷積神經(jīng)網(wǎng)絡(luò)輸入，獲取深度卷積神經(jīng)網(wǎng)絡(luò)輸出的預(yù)設(shè)個(gè)數(shù)的二分類概率，其中，每個(gè)二分類概率對(duì)應(yīng)一個(gè)類別，且每個(gè)二分類概率互不相關(guān)。

其中，該深度卷積神經(jīng)網(wǎng)絡(luò)的二維神經(jīng)元全連接層包括利用邏輯回歸函數(shù)確定的預(yù)設(shè)個(gè)數(shù)的二維神經(jīng)元。

邏輯回歸(logisticregression)是當(dāng)前比較常用的機(jī)器學(xué)習(xí)方法，用于估計(jì)某種事物的可能性，是一個(gè)非線性分類模型，它與普通線性回歸的不同點(diǎn)在于能夠?qū)⒕€性回歸輸出的很大范圍的數(shù)，例如從負(fù)無(wú)窮到正無(wú)窮，壓縮到0和1之間，以0到1之間的浮點(diǎn)數(shù)為輸出值表示為該函數(shù)的概率值。邏輯回歸函數(shù)經(jīng)常用于分類，主要是二分類，也可以是多分類。所謂二分類，包含正類和負(fù)類，正類代表該樣本所表示命題為真，負(fù)類代表該樣本所表示命題為假，因此二分類概率就包括樣本屬于正類的概率值和屬于負(fù)類的概率值，示例的，當(dāng)樣本屬于正類的概率值大于0.5，那么就可以判定它是正類，否則就是負(fù)類，其中正類的概率值和負(fù)類的概率值之和為1，即可以理解為該二分類概率包括了該目標(biāo)圖像屬于對(duì)應(yīng)類別的概率，以及不屬于該對(duì)應(yīng)類別的概率，當(dāng)該目標(biāo)圖像屬于(該二分類概率的)對(duì)應(yīng)類別的概率大于一定閾值時(shí)，可以確定該目標(biāo)圖像屬于這一類別，當(dāng)該目標(biāo)圖像不屬于該對(duì)應(yīng)類別的概率大于一定閾值時(shí)，可以確定該目標(biāo)圖像不屬于這一類別。

因此，經(jīng)過(guò)二維神經(jīng)元全連接層后輸出的深度卷積神經(jīng)網(wǎng)絡(luò)的可以是1000個(gè)互不干擾的二分類概率，每個(gè)二分類概率分別對(duì)應(yīng)一個(gè)類別，用于分別指示該目標(biāo)圖像屬于和不屬于每個(gè)類別的概率，之后根據(jù)該輸出的[c_1，c_2，…，c_k]可以確定該目標(biāo)圖像的所有類別標(biāo)簽。

在步驟304中，根據(jù)所有的二分類概率確定目標(biāo)圖像的類別。

示例地，由于在步驟303中輸出的1000個(gè)c_i互不相關(guān)，因此根據(jù)這1000個(gè)c_i互不相關(guān)的二分類概率能確定出目標(biāo)圖像的類別可能有1到1000個(gè)，因此根據(jù)所有二分類概率能確定出的目標(biāo)圖像的類別不再唯一。

綜上所述，本公開實(shí)施例所提供的圖像類別的確定方法，該方法通過(guò)獲取目標(biāo)圖像的圖像數(shù)據(jù)；通過(guò)后向傳遞算法確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)，該深度卷積神經(jīng)網(wǎng)絡(luò)用于對(duì)圖像數(shù)據(jù)進(jìn)行識(shí)別；在確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)后，將圖像數(shù)據(jù)作為深度卷積神經(jīng)網(wǎng)絡(luò)輸入，獲取深度卷積神經(jīng)網(wǎng)絡(luò)輸出的預(yù)設(shè)個(gè)數(shù)的二分類概率；之后根據(jù)所有的二分類概率確定目標(biāo)圖像的類別。本公開實(shí)施例所提供的技術(shù)方案通過(guò)改進(jìn)深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)，使得深度卷積神經(jīng)網(wǎng)絡(luò)輸出互不相關(guān)的二分類概率，能夠?qū)崿F(xiàn)對(duì)圖像的多標(biāo)簽分類。

圖4是根據(jù)一示例性實(shí)施例示出的一種圖像類別的確定方法的流程圖，如圖4所示，圖3中的步驟302所述的通過(guò)后向傳遞算法確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)，該深度卷積神經(jīng)網(wǎng)絡(luò)用于對(duì)圖像數(shù)據(jù)進(jìn)行識(shí)別，包括以下步驟：

在步驟3021中，分別對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)建立臨時(shí)存儲(chǔ)器。

為了防止在迭代鏈?zhǔn)角髮?dǎo)確定參數(shù)的過(guò)程中，會(huì)造成參數(shù)的逐層覆蓋，可以分別為每層的每個(gè)參數(shù)度一應(yīng)的建立臨時(shí)的存儲(chǔ)器，以在每一輪計(jì)算中存儲(chǔ)對(duì)應(yīng)參數(shù)的梯度值，確保深度卷積神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果之間相互獨(dú)立。其中，需要說(shuō)明的是，在本實(shí)施例中意圖2所示的網(wǎng)絡(luò)結(jié)構(gòu)為例，上述的一輪計(jì)算是指從輸入層(第一個(gè)卷基層)到輸出層(二維神經(jīng)元全連接層)完成一次參數(shù)更新。

在步驟3022中，利用為深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)建立的臨時(shí)存儲(chǔ)器，通過(guò)后向傳遞算法訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)。

其中，當(dāng)深度卷積神經(jīng)網(wǎng)絡(luò)中的所有層執(zhí)行一次訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟后，再次執(zhí)行所述訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟，直至深度卷積神經(jīng)網(wǎng)絡(luò)中每層的每個(gè)參數(shù)的梯度值滿足預(yù)設(shè)的收斂條件時(shí)，將深度卷積神經(jīng)網(wǎng)絡(luò)中每層的每個(gè)參數(shù)的當(dāng)前值確定為深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)。

也就是說(shuō)，通過(guò)后向傳遞算法訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的方式是迭代的，該步驟實(shí)施方式參見下面圖5的實(shí)施例，首先從深度卷積神經(jīng)網(wǎng)絡(luò)的最后一層，也就是二維神經(jīng)元全連接層開始進(jìn)行步驟30221，除了最后一層外其他層進(jìn)行步驟30222的操作。本實(shí)施例中所述的當(dāng)前層可以理解為正在進(jìn)行參數(shù)更新計(jì)算的這一層，該當(dāng)前層可以是深度卷積神經(jīng)網(wǎng)絡(luò)中的任一層。另外，對(duì)該深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí)，該輸入數(shù)據(jù)可以為預(yù)設(shè)置的若干個(gè)標(biāo)簽圖像。

圖5是根據(jù)一示例性實(shí)施例示出的一種圖像類別的確定方法的流程圖，如圖5所示，以深度卷積神經(jīng)網(wǎng)絡(luò)中的任一層為例，圖4中的步驟3022所述的訓(xùn)練所述深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟包括：

在步驟30221中，在深度卷積神經(jīng)網(wǎng)絡(luò)的當(dāng)前層不存在下一層時(shí)，將當(dāng)前層的每個(gè)參數(shù)，分別與當(dāng)前層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值相加，得到當(dāng)前層的更新后的參數(shù)。

例如，輸出層(二維神經(jīng)元全連接層)是上述cnn網(wǎng)絡(luò)中的第八層，也是最后一層，因此輸出層的每個(gè)參數(shù)的更新可以執(zhí)行步驟30221，以該層中的參數(shù)a為例，該參數(shù)a的原值(或稱為當(dāng)前值，即本次更新以前參數(shù)a的值)為a0，那么參數(shù)a更新后的參數(shù)是參數(shù)a對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中的梯度值ad與參數(shù)a的原值a0之和，表示為anew＝ad+a0，之后進(jìn)行步驟30224的操作。其中，參數(shù)a可以是輸出層中的任一參數(shù)，在第一次更新參數(shù)a時(shí)，參數(shù)a對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中的梯度值ad是在上一次更新參數(shù)a后計(jì)算得到的參數(shù)a的梯度值，因此如果是第一次更新參數(shù)a，參數(shù)a對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中的梯度值ad為零。

在步驟30222中，在深度卷積神經(jīng)網(wǎng)絡(luò)的當(dāng)前層存在下一層時(shí)，將當(dāng)前層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值，分別與下一層的臨時(shí)存儲(chǔ)器中存儲(chǔ)的與當(dāng)前層的每個(gè)參數(shù)關(guān)聯(lián)的參數(shù)的梯度值相加，得到當(dāng)前層的每個(gè)參數(shù)的新的梯度值。

其中，當(dāng)前層和下一層為深度卷積神經(jīng)網(wǎng)絡(luò)中任意相鄰的兩層。每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值是在上次執(zhí)行所述訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟時(shí)得到的，該深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值的初始值為零。

例如，對(duì)于上述cnn網(wǎng)絡(luò)的第一層至第七層，均具有下一層，以第七層為例，第七層的下一層就是上述的第八層，也就是輸出層。假設(shè)對(duì)于第七層的參數(shù)b，該參數(shù)的原值為b0，參數(shù)b對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值為bd，bd是在上一次更新參數(shù)b后計(jì)算得到的參數(shù)b的梯度值，因此如果是第一次更新參數(shù)b，參數(shù)b對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中的梯度值bd為零。假設(shè)在第八層與參數(shù)b關(guān)聯(lián)的參數(shù)分別有d、e、f，參數(shù)d、e、f分別對(duì)應(yīng)的臨時(shí)存儲(chǔ)其中分別存儲(chǔ)了參數(shù)d、e、f的梯度值dd’、ed’和fd’(梯度值dd’、ed’和fd’，是在第八層執(zhí)行完步驟3021以及步驟3024～3026后得到的)，則參數(shù)b的新的梯度值bdnew為bd、dd’、ed’和fd’之和。

在步驟30223中，將當(dāng)前層的每個(gè)參數(shù)的新的梯度值，分別與當(dāng)前層的每個(gè)參數(shù)相加，得到當(dāng)前層的更新后的參數(shù)。

例如，對(duì)于第七層的參數(shù)b，更新后的參數(shù)b為參數(shù)b的原值b0與參數(shù)b的新的梯度值bdnew之和。

綜上，通過(guò)上述步驟30221可以對(duì)cnn網(wǎng)絡(luò)中最后一層進(jìn)行參數(shù)更新，通過(guò)步驟30222和步驟30223可以對(duì)除了最后一層以外其他所有層的參數(shù)進(jìn)行更新，在每一層的參數(shù)完成更新后，再對(duì)更新后的參數(shù)進(jìn)行步驟30224的操作，以確定更新后的參數(shù)的梯度值，進(jìn)而完成對(duì)臨時(shí)存儲(chǔ)器中的梯度值的更新。

在步驟30224中，獲取當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值。

示例的，以步驟30221中的參數(shù)a為例，在得到參數(shù)a的更新后的參數(shù)anew后，計(jì)算anew的當(dāng)前梯度值，記為ad’，并執(zhí)行步驟30223以將ad’存儲(chǔ)在參數(shù)a對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中替換之前存儲(chǔ)的ad。其中，步驟30222中涉及的梯度值dd’、ed’和fd’也是通過(guò)同樣方法得到并存儲(chǔ)在對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中的。這樣，在后向傳遞算法中對(duì)梯度值的逐層求解，每層的每個(gè)參數(shù)的當(dāng)前梯度值都是根據(jù)更新后的參數(shù)而確定的，以保證的該參數(shù)的實(shí)時(shí)更迭。

在步驟30225中，將當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值存儲(chǔ)在與當(dāng)前層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中。

將當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值存儲(chǔ)在對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中，以便在再一次執(zhí)行步驟30221～30226所述的訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟時(shí)，用于對(duì)各層的各個(gè)參數(shù)進(jìn)行更新，也就是步驟30221或者步驟30222所進(jìn)行的參數(shù)更新。由此可見，通過(guò)為每層的每個(gè)參數(shù)設(shè)置臨時(shí)存儲(chǔ)器，使得每一層的每個(gè)參數(shù)在更新后，都將更新后的梯度值進(jìn)行獨(dú)立存儲(chǔ)，使得上一層在更新參數(shù)時(shí)能夠利用相鄰的下層中相關(guān)聯(lián)參數(shù)的梯度值進(jìn)行參數(shù)更新，因此參數(shù)更新后的梯度值在迭代過(guò)程中并非被直接覆蓋，而是傳遞到了上一層。

在步驟30226中，判斷深度卷積神經(jīng)網(wǎng)絡(luò)中每層的每個(gè)參數(shù)的梯度值是否滿足預(yù)設(shè)的收斂條件。

當(dāng)滿足預(yù)設(shè)的收斂條件時(shí)，結(jié)束對(duì)該深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的訓(xùn)練，繼續(xù)步驟303的操作。如果深度卷積神經(jīng)網(wǎng)絡(luò)中還存在不滿足收斂條件的參數(shù)，則再次執(zhí)行步驟30221～30226所述的訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟，直至深度卷積神經(jīng)網(wǎng)絡(luò)中每層的每個(gè)參數(shù)的梯度值均滿足預(yù)設(shè)的收斂條件時(shí)，將深度卷積神經(jīng)網(wǎng)絡(luò)中每層的每個(gè)參數(shù)的當(dāng)前值確定為深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)，此時(shí)就完成了深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的訓(xùn)練。

示例的，該預(yù)設(shè)的收斂條件可以設(shè)置為深度卷積神經(jīng)網(wǎng)絡(luò)的每層的參數(shù)的梯度值為0，或者該梯度值小于一個(gè)較小的預(yù)設(shè)值，當(dāng)滿足該預(yù)設(shè)的收斂條件時(shí)，說(shuō)明此時(shí)的深度卷積神經(jīng)網(wǎng)絡(luò)的各層的每個(gè)參數(shù)已經(jīng)接近理想需求，可以結(jié)束對(duì)參數(shù)的訓(xùn)練，進(jìn)行對(duì)圖像的類別的識(shí)別操作。

而當(dāng)仍不滿足預(yù)設(shè)的收斂條件時(shí)，說(shuō)明還需對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行訓(xùn)練，返回步驟30221，重新從最后一層從后向前再次開始參數(shù)訓(xùn)練，直到滿足本步驟的判斷條件為止。

圖6是根據(jù)一示例性實(shí)施例示出的一種圖像類別的確定方法的流程圖，如圖6所示，圖3中的步驟304所述的根據(jù)所有的二分類概率確定目標(biāo)圖像的類別，包括：

在步驟3041中，將所有的二分類概率中肯定概率值大于預(yù)設(shè)概率閾值的二分類概率，確定為目標(biāo)二分類概率。

以步驟304中輸出的1000個(gè)c_i為例，可以預(yù)先設(shè)置一個(gè)概率閾值，用于過(guò)濾肯定概率值過(guò)低的二分類概率所對(duì)應(yīng)的類別，例如可以設(shè)置該概率閾值為：0.5，當(dāng)c_i＝1的概率值低于或等于0.5時(shí)，可以確定該目標(biāo)圖像不屬于該c_i對(duì)應(yīng)的類別，當(dāng)c_i＝1的概率值大于0.5時(shí)，可以確定該目標(biāo)圖像屬于該c_i對(duì)應(yīng)的類別。當(dāng)然，也可以通過(guò)否定概率來(lái)確定目標(biāo)圖像的分類，例如，可以是將所有的二分類概率中否定概率值小于預(yù)設(shè)概率閾值的二分類概率，確定為目標(biāo)二分類概率。

在步驟3042中，將所有目標(biāo)二分類概率所對(duì)應(yīng)類別確定為目標(biāo)圖像的類別。

經(jīng)過(guò)步驟3041的確定的目標(biāo)二分類概率所有對(duì)應(yīng)的類別是目標(biāo)圖像可能屬于的類別集合，類別集合中可以包括一個(gè)或者多個(gè)類別標(biāo)簽。由于所有二分類概率是相互獨(dú)立的，因此所有二分類概率互相不干擾，因此目標(biāo)圖像是各個(gè)目標(biāo)二分類概率對(duì)應(yīng)的類別的概率也不再是此消彼長(zhǎng)，而是互不影響的，因此基于上述方法能夠確定的該目標(biāo)圖像的多個(gè)分類，從而能夠?qū)崿F(xiàn)該目標(biāo)圖像的多標(biāo)簽分類。

圖7是根據(jù)一示例性實(shí)施例示出的一種圖像類別的確定裝置的框圖，如圖7所示，該裝置700包括：

圖像數(shù)據(jù)獲取模塊710，被配置為獲取目標(biāo)圖像的圖像數(shù)據(jù)。

圖像數(shù)據(jù)識(shí)別模塊720，被配置為通過(guò)后向傳遞算法確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)，深度卷積神經(jīng)網(wǎng)絡(luò)用于對(duì)圖像數(shù)據(jù)進(jìn)行識(shí)別。

二分類概率輸出模塊730，被配置為在確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)后，將圖像數(shù)據(jù)作為深度卷積神經(jīng)網(wǎng)絡(luò)輸入，獲取深度卷積神經(jīng)網(wǎng)絡(luò)輸出的預(yù)設(shè)個(gè)數(shù)的二分類概率，其中，每個(gè)二分類概率對(duì)應(yīng)一個(gè)類別，且每個(gè)二分類概率互不相關(guān)。

圖像類別確定模塊740，被配置為根據(jù)所有的二分類概率確定目標(biāo)圖像的類別。

可選的，該深度卷積神經(jīng)網(wǎng)絡(luò)，包括：二維神經(jīng)元全連接層，至少一個(gè)一維神經(jīng)元全連接層和至少一個(gè)卷積層，其中，二維神經(jīng)元全連接層位于至少一個(gè)一維神經(jīng)元全連接層的下層，至少一個(gè)一維神經(jīng)元全連接層位于至少一個(gè)卷積層的下層。

可選的，圖8是根據(jù)一示例性實(shí)施例示出的一種圖像數(shù)據(jù)識(shí)別模塊的框圖，如圖8所示，該圖像數(shù)據(jù)識(shí)別模塊720，包括存儲(chǔ)器建立子模塊721和參數(shù)訓(xùn)練子模塊722：

存儲(chǔ)器建立子模塊721，被配置為分別對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)建立臨時(shí)存儲(chǔ)器。

參數(shù)訓(xùn)練子模塊722，被配置為利用為深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)建立的臨時(shí)存儲(chǔ)器，通過(guò)后向傳遞算法訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)。

其中，當(dāng)深度卷積神經(jīng)網(wǎng)絡(luò)中的所有層執(zhí)行一次訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟后，再次執(zhí)行訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟，直至深度卷積神經(jīng)網(wǎng)絡(luò)中每層的每個(gè)參數(shù)的梯度值滿足預(yù)設(shè)的收斂條件時(shí)，將深度卷積神經(jīng)網(wǎng)絡(luò)中每層的每個(gè)參數(shù)的當(dāng)前值確定為深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)。

可選的，該參數(shù)訓(xùn)練子模塊722，被配置為：在深度卷積神經(jīng)網(wǎng)絡(luò)的當(dāng)前層不存在下一層時(shí)，將當(dāng)前層的每個(gè)參數(shù)，分別與當(dāng)前層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值相加，得到當(dāng)前層的更新后的參數(shù)；其中，每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值是在上次執(zhí)行訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟時(shí)得到的，深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值的初始值為零；

獲取當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值；

將當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值存儲(chǔ)在與當(dāng)前層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中。

可選的，參數(shù)訓(xùn)練子模塊722，還被配置為：在深度卷積神經(jīng)網(wǎng)絡(luò)的當(dāng)前層存在下一層時(shí)，將當(dāng)前層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值，分別與下一層的臨時(shí)存儲(chǔ)器中存儲(chǔ)的與當(dāng)前層的每個(gè)參數(shù)關(guān)聯(lián)的參數(shù)的梯度值相加，得到當(dāng)前層的每個(gè)參數(shù)的新的梯度值；其中，每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值是在上次執(zhí)行訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)的步驟時(shí)得到的，深度卷積神經(jīng)網(wǎng)絡(luò)的每層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中存儲(chǔ)的梯度值的初始值為零；

將當(dāng)前層的每個(gè)參數(shù)的新的梯度值，分別與當(dāng)前層的每個(gè)參數(shù)相加，得到當(dāng)前層的更新后的參數(shù)；

獲取當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值；

將當(dāng)前層的每個(gè)更新后的參數(shù)的當(dāng)前梯度值存儲(chǔ)在與當(dāng)前層的每個(gè)參數(shù)對(duì)應(yīng)的臨時(shí)存儲(chǔ)器中；

其中，當(dāng)前層和下一層為深度卷積神經(jīng)網(wǎng)絡(luò)中任意相鄰的兩層。

可選的，二分類概率包括，肯定概率值和否定概率值，肯定概率值是圖像屬于二分類概率對(duì)應(yīng)分類的概率值，肯定概率值和否定概率值之和為1。

圖9是根據(jù)一示例性實(shí)施例示出的一種圖像類別確定模塊的框圖，如圖9所示，該圖像數(shù)據(jù)識(shí)別模塊740，包括：

二分類概率識(shí)別子模塊741，被配置為將所有的二分類概率中肯定概率值大于預(yù)設(shè)概率閾值的二分類概率，確定為目標(biāo)二分類概率。

圖像類別確定子模塊742，被配置為將所有目標(biāo)二分類概率所對(duì)應(yīng)類別確定為目標(biāo)圖像的類別。

可選的，二維神經(jīng)元全連接層包括利用邏輯回歸函數(shù)確定的預(yù)設(shè)個(gè)數(shù)的二維神經(jīng)元。

綜上所述，本公開所提供的圖像類別的確定裝置，該方法通過(guò)獲取目標(biāo)圖像的圖像數(shù)據(jù)；通過(guò)后向傳遞算法確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)，該深度卷積神經(jīng)網(wǎng)絡(luò)用于對(duì)圖像數(shù)據(jù)進(jìn)行識(shí)別；在確定深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)參數(shù)后，將圖像數(shù)據(jù)作為深度卷積神經(jīng)網(wǎng)絡(luò)輸入，獲取深度卷積神經(jīng)網(wǎng)絡(luò)輸出的預(yù)設(shè)個(gè)數(shù)的二分類概率；之后根據(jù)所有的二分類概率確定目標(biāo)圖像的類別。本公開所提供的技術(shù)方案通過(guò)改進(jìn)深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)，使得深度卷積神經(jīng)網(wǎng)絡(luò)輸出互不相關(guān)的二分類概率，能夠?qū)崿F(xiàn)對(duì)圖像的多標(biāo)簽分類。

關(guān)于上述實(shí)施例中的裝置，其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述，此處將不做詳細(xì)闡述說(shuō)明。

圖10是根據(jù)另一示例性實(shí)施例示出的一種圖像類別的確定裝置1000的框圖。例如，裝置1000可以是移動(dòng)電話，計(jì)算機(jī)，數(shù)字廣播終端，消息收發(fā)設(shè)備，游戲控制臺(tái)，平板設(shè)備，醫(yī)療設(shè)備，健身設(shè)備，個(gè)人數(shù)字助理等。

參照?qǐng)D10，裝置1000可以包括以下一個(gè)或多個(gè)組件：處理組件1002，存儲(chǔ)器1004，電力組件1006，多媒體組件1008，音頻組件1010，輸入/輸出(i/o)的接口1012，傳感器組件1014，以及通信組件1016。

處理組件1002通?？刂蒲b置1000的整體操作，諸如與顯示，電話呼叫，數(shù)據(jù)通信，相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件1002可以包括一個(gè)或多個(gè)處理器1020來(lái)執(zhí)行指令，以完成圖像類別的確定的全部或部分步驟。此外，處理組件1002可以包括一個(gè)或多個(gè)模塊，便于處理組件1002和其他組件之間的交互。例如，處理組件1002可以包括多媒體模塊，以方便多媒體組件1008和處理組件1002之間的交互。

存儲(chǔ)器1004被配置為存儲(chǔ)各種類型的數(shù)據(jù)以支持在裝置1000的操作。這些數(shù)據(jù)的示例包括用于在裝置1000上操作的任何應(yīng)用程序或方法的指令，聯(lián)系人數(shù)據(jù)，電話簿數(shù)據(jù)，消息，圖像，視頻等。存儲(chǔ)器1004可以由任何類型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn)，如靜態(tài)隨機(jī)存取存儲(chǔ)器(sram)，電可擦除可編程只讀存儲(chǔ)器(eeprom)，可擦除可編程只讀存儲(chǔ)器(eprom)，可編程只讀存儲(chǔ)器(prom)，只讀存儲(chǔ)器(rom)，磁存儲(chǔ)器，快閃存儲(chǔ)器，磁盤或光盤。

電力組件1006為裝置1000的各種組件提供電力。電力組件1006可以包括電源管理系統(tǒng)，一個(gè)或多個(gè)電源，及其他與為裝置1000生成、管理和分配電力相關(guān)聯(lián)的組件。

多媒體組件1008包括在所述裝置1000和用戶之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中，屏幕可以包括液晶顯示器(lcd)和觸摸面板(tp)。如果屏幕包括觸摸面板，屏幕可以被實(shí)現(xiàn)為觸摸屏，以接收來(lái)自用戶的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測(cè)觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測(cè)觸摸或滑動(dòng)動(dòng)作的邊界，而且還檢測(cè)與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中，多媒體組件1008包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)裝置1000處于操作模式，如拍攝模式或視頻模式時(shí)，前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。

音頻組件1010被配置為輸出和/或輸入音頻信號(hào)。例如，音頻組件1010包括一個(gè)麥克風(fēng)(mic)，當(dāng)裝置1000處于操作模式，如呼叫模式、記錄模式和語(yǔ)音識(shí)別模式時(shí)，麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器1004或經(jīng)由通信組件1016發(fā)送。在一些實(shí)施例中，音頻組件1010還包括一個(gè)揚(yáng)聲器，用于輸出音頻信號(hào)。

i/o接口1012為處理組件1002和外圍接口模塊之間提供接口，上述外圍接口模塊可以是鍵盤，點(diǎn)擊輪，按鈕等。這些按鈕可包括但不限于：主頁(yè)按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。

傳感器組件1014包括一個(gè)或多個(gè)傳感器，用于為裝置1000提供各個(gè)方面的狀態(tài)評(píng)估。例如，傳感器組件1014可以檢測(cè)到裝置1000的打開/關(guān)閉狀態(tài)，組件的相對(duì)定位，例如所述組件為裝置1000的顯示器和小鍵盤，傳感器組件1014還可以檢測(cè)裝置1000或裝置1000一個(gè)組件的位置改變，用戶與裝置1000接觸的存在或不存在，裝置1000方位或加速/減速和裝置1000的溫度變化。傳感器組件1014可以包括接近傳感器，被配置用來(lái)在沒有任何的物理接觸時(shí)檢測(cè)附近物體的存在。傳感器組件1014還可以包括光傳感器，如cmos或ccd圖像傳感器，用于在成像應(yīng)用中使用。在一些實(shí)施例中，該傳感器組件1014還可以包括加速度傳感器，陀螺儀傳感器，磁傳感器，壓力傳感器或溫度傳感器。

通信組件1016被配置為便于裝置1000和其他設(shè)備之間有線或無(wú)線方式的通信。裝置1000可以接入基于通信標(biāo)準(zhǔn)的無(wú)線網(wǎng)絡(luò)，如wifi，2g或3g，或它們的組合。在一個(gè)示例性實(shí)施例中，通信組件1016經(jīng)由廣播信道接收來(lái)自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中，所述通信組件1016還包括近場(chǎng)通信(nfc)模塊，以促進(jìn)短程通信。例如，在nfc模塊可基于射頻識(shí)別(rfid)技術(shù)，紅外數(shù)據(jù)協(xié)會(huì)(irda)技術(shù)，超寬帶(uwb)技術(shù)，藍(lán)牙(bt)技術(shù)和其他技術(shù)來(lái)實(shí)現(xiàn)。

在示例性實(shí)施例中，裝置1000可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(asic)、數(shù)字信號(hào)處理器(dsp)、數(shù)字信號(hào)處理設(shè)備(dspd)、可編程邏輯器件(pld)、現(xiàn)場(chǎng)可編程門陣列(fpga)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn)，用于執(zhí)行圖像類別的確定。

在示例性實(shí)施例中，還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，例如包括指令的存儲(chǔ)器1004，上述指令可由裝置1000的處理器1020執(zhí)行以完成圖像類別的確定。例如，所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是rom、隨機(jī)存取存儲(chǔ)器(ram)、cd-rom、磁帶、軟盤和光數(shù)據(jù)存儲(chǔ)設(shè)備等。

本領(lǐng)域技術(shù)人員在考慮說(shuō)明書及實(shí)踐本公開后，將容易想到本公開的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化，這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說(shuō)明書和實(shí)施例僅被視為示例性的，本公開的真正范圍和精神由下面的權(quán)利要求指出。

應(yīng)當(dāng)理解的是，本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu)，并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來(lái)限制。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：萬(wàn)韶華
技術(shù)所有人：北京小米移動(dòng)軟件有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

生產(chǎn)裝置類別相關(guān)技術(shù)

生產(chǎn)裝置火災(zāi)危險(xiǎn)類別相關(guān)技術(shù)

挖掘機(jī)凈化裝置被類別相關(guān)技術(shù)

接地裝置名稱類別相關(guān)技術(shù)

電能計(jì)量裝置類別相關(guān)技術(shù)

射線裝置類別相關(guān)技術(shù)

裝置類別相關(guān)技術(shù)

圖像收發(fā)裝置相關(guān)技術(shù)

日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

圖像類別的確定方法、裝置及存儲(chǔ)介質(zhì)與流程