本發(fā)明涉及標(biāo)簽處理技術(shù),尤其涉及一種標(biāo)簽的處理方法及裝置。
背景技術(shù):
::社會(huì)標(biāo)簽(Socialtagging)簡稱為標(biāo)簽,是一種更為靈活、有趣的分類方式,它允許用戶自由地標(biāo)注各種資源,例如網(wǎng)頁、學(xué)術(shù)論文和多媒體等資源。社會(huì)標(biāo)簽可以幫助用戶分類整理和查詢各類信息,廣泛應(yīng)用于社會(huì)標(biāo)簽網(wǎng)站(例如,F(xiàn)lickr、Picassa、YouTube、Plaxo等)、博客(例如,Blogger、WordPress、LiveJournal等)、百科(例如,Wikipedia、PBWiki等)、微博(例如,Twitter、Jaiku等)等系統(tǒng)。現(xiàn)有技術(shù)中,提供了對資源進(jìn)行單一標(biāo)簽分類的方法,以生成資源的一個(gè)標(biāo)簽。然而,由于客觀事物本身的復(fù)雜性,一個(gè)資源可能同時(shí)具有多個(gè)不同的標(biāo)簽,如何對資源進(jìn)行多標(biāo)簽分類,以生成資源的多個(gè)標(biāo)簽,已經(jīng)成為目前的一個(gè)研究熱點(diǎn)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的多個(gè)方面提供一種標(biāo)簽的處理方法及裝置,用以獲得資源的多個(gè)標(biāo)簽。本發(fā)明的一方面,提供一種標(biāo)簽的處理方法,包括:獲取資源的語義特征數(shù)據(jù);根據(jù)所述資源的語義特征數(shù)據(jù),獲得所述資源的至少一個(gè)標(biāo)簽序列的后 驗(yàn)概率;根據(jù)所述后驗(yàn)概率,選擇一個(gè)標(biāo)簽序列,以作為所述資源的標(biāo)簽集合。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述獲取資源的語義特征數(shù)據(jù),包括:利用預(yù)先構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò),對所述資源進(jìn)行處理,以獲得所述資源的語義特征數(shù)據(jù)。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述方法還包括:根據(jù)標(biāo)簽在第一訓(xùn)練樣本集中的出現(xiàn)情況,對所述第一訓(xùn)練樣本集中每個(gè)第一訓(xùn)練樣本中所包含的至少一個(gè)標(biāo)簽進(jìn)行排序處理,以獲得所述第一每個(gè)訓(xùn)練樣本的樣本序列;根據(jù)所述第一每個(gè)訓(xùn)練樣本的樣本序列,構(gòu)建所述卷積神經(jīng)網(wǎng)絡(luò)。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所述資源的語義特征數(shù)據(jù),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率,包括:根據(jù)所述資源的語義特征數(shù)據(jù),利用預(yù)先構(gòu)建的遞歸神經(jīng)網(wǎng)絡(luò),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述方法還包括:根據(jù)標(biāo)簽在第二訓(xùn)練樣本集中的出現(xiàn)情況,對所述第二訓(xùn)練樣本集中每個(gè)第二訓(xùn)練樣本中所包含的至少一個(gè)標(biāo)簽進(jìn)行排序處理,以獲得所述每個(gè)第二訓(xùn)練樣本的樣本序列;獲取所述第二訓(xùn)練樣本集中每個(gè)第二訓(xùn)練樣本中所包含的一個(gè)資源的語 義特征數(shù)據(jù);根據(jù)所述每個(gè)第二訓(xùn)練樣本的樣本序列和所述每個(gè)第二訓(xùn)練樣本中所包含的一個(gè)資源的語義特征數(shù)據(jù),構(gòu)建所述遞歸神經(jīng)網(wǎng)絡(luò)。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所述后驗(yàn)概率,選擇一個(gè)標(biāo)簽序列,包括:根據(jù)所述后驗(yàn)概率,從所述資源的全部標(biāo)簽序列中,選擇所述一個(gè)標(biāo)簽序列;或者根據(jù)所述后驗(yàn)概率,從所述資源的部分標(biāo)簽序列中,選擇所述一個(gè)標(biāo)簽序列。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述資源包括圖像。本發(fā)明的另一方面,提供一種標(biāo)簽的處理裝置,包括:獲取單元,用于獲取資源的語義特征數(shù)據(jù);處理單元,用于根據(jù)所述資源的語義特征數(shù)據(jù),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率;選擇單元,用于根據(jù)所述后驗(yàn)概率,選擇一個(gè)標(biāo)簽序列,以作為所述資源的標(biāo)簽集合。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述獲取單元,具體用于利用預(yù)先構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò),對所述資源進(jìn)行處理,以獲得所述資源的語義特征數(shù)據(jù)。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所 述獲取單元,還用于根據(jù)標(biāo)簽在第一訓(xùn)練樣本集中的出現(xiàn)情況,對所述第一訓(xùn)練樣本集中每個(gè)第一訓(xùn)練樣本中所包含的至少一個(gè)標(biāo)簽進(jìn)行排序處理,以獲得所述第一每個(gè)訓(xùn)練樣本的樣本序列;以及根據(jù)所述第一每個(gè)訓(xùn)練樣本的樣本序列,構(gòu)建所述卷積神經(jīng)網(wǎng)絡(luò)。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述處理單元,具體用于根據(jù)所述資源的語義特征數(shù)據(jù),利用預(yù)先構(gòu)建的遞歸神經(jīng)網(wǎng)絡(luò),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述處理單元,還用于根據(jù)標(biāo)簽在第二訓(xùn)練樣本集中的出現(xiàn)情況,對所述第二訓(xùn)練樣本集中每個(gè)第二訓(xùn)練樣本中所包含的至少一個(gè)標(biāo)簽進(jìn)行排序處理,以獲得所述每個(gè)第二訓(xùn)練樣本的樣本序列;獲取所述第二訓(xùn)練樣本集中每個(gè)第二訓(xùn)練樣本中所包含的一個(gè)資源的語義特征數(shù)據(jù);以及根據(jù)所述每個(gè)第二訓(xùn)練樣本的樣本序列和所述每個(gè)第二訓(xùn)練樣本中所包含的一個(gè)資源的語義特征數(shù)據(jù),構(gòu)建所述遞歸神經(jīng)網(wǎng)絡(luò)。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述選擇單元,具體用于根據(jù)所述后驗(yàn)概率,從所述資源的全部標(biāo)簽序列中,選擇所述一個(gè)標(biāo)簽序列;或者根據(jù)所述后驗(yàn)概率,從所述資源的部分標(biāo)簽序列中,選擇所述一個(gè)標(biāo)簽序列。如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述資源包括圖像。由上述技術(shù)方案可知,本發(fā)明實(shí)施例通過獲取資源的語義特征數(shù)據(jù),進(jìn)而根據(jù)所述資源的語義特征數(shù)據(jù),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率,使得能夠根據(jù)所述后驗(yàn)概率,選擇一個(gè)標(biāo)簽序列,以作為所述資源的標(biāo)簽集合,從而實(shí)現(xiàn)了獲得資源的多個(gè)標(biāo)簽的目的。另外,采用本發(fā)明所提供的技術(shù)方案,由于考慮了標(biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性等,使得能夠獲得資源的一個(gè)標(biāo)簽序列,而不是分別采用單標(biāo)簽分類的方法,單獨(dú)地獲得資源的若干個(gè)相互獨(dú)立的標(biāo)簽,因此,能夠有效提高資源的標(biāo)簽獲得的可靠性。另外,采用本發(fā)明所提供的技術(shù)方案,通過利用卷積神經(jīng)網(wǎng)絡(luò),使得能夠獲得更為準(zhǔn)確的資源的語義特征數(shù)據(jù),因此,能夠有效提高資源的語義特征數(shù)據(jù)獲取的可靠性。另外,采用本發(fā)明所提供的技術(shù)方案,通過利用遞歸神經(jīng)網(wǎng)絡(luò),使得能夠?qū)?biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性等表示出來,因此,能夠有效提高資源的標(biāo)簽獲得的可靠性。另外,采用本發(fā)明所提供的技術(shù)方案,通過構(gòu)建遞歸神經(jīng)網(wǎng)絡(luò),使得能夠快速地學(xué)習(xí)標(biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性等,因此,能夠有效提高標(biāo)簽序列的關(guān)聯(lián)關(guān)系學(xué)習(xí)的效率?!靖綀D說明】為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明一實(shí)施例提供的標(biāo)簽的處理方法的流程示意圖;圖2為本發(fā)明另一實(shí)施例提供的標(biāo)簽的處理裝置的結(jié)構(gòu)示意圖。【具體實(shí)施方式】為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的全部其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。需要說明的是,本發(fā)明實(shí)施例中所涉及的終端可以包括但不限于手機(jī)、個(gè)人數(shù)字助理(PersonalDigitalAssistant,PDA)、無線手持設(shè)備、平板電腦(TabletComputer)、個(gè)人電腦(PersonalComputer,PC)、MP3播放器、MP4播放器、可穿戴設(shè)備(例如,智能眼鏡、智能手表、智能手環(huán)等)等。另外,本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨(dú)存在A,同時(shí)存在A和B,單獨(dú)存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。圖1為本發(fā)明一實(shí)施例提供的標(biāo)簽的處理方法的流程示意圖,如圖1所示。101、獲取資源的語義特征數(shù)據(jù)。102、根據(jù)所述資源的語義特征數(shù)據(jù),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率。103、根據(jù)所述后驗(yàn)概率,選擇一個(gè)標(biāo)簽序列,以作為所述資源的標(biāo)簽集合。需要說明的是,101~103的執(zhí)行主體的部分或全部可以為位于本地終端的應(yīng)用,或者還可以為設(shè)置在位于本地終端的應(yīng)用中的插件或軟件開發(fā)工具包(SoftwareDevelopmentKit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)服務(wù)器中的處理引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實(shí)施例對此不進(jìn)行特別限定??梢岳斫獾氖牵鰬?yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個(gè)網(wǎng)頁程序(webApp),本實(shí)施例對此不進(jìn)行特別限定。這樣,通過獲取資源的語義特征數(shù)據(jù),進(jìn)而根據(jù)所述資源的語義特征數(shù)據(jù),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率,使得能夠根據(jù)所述后驗(yàn)概率,選擇一個(gè)標(biāo)簽序列,以作為所述資源的標(biāo)簽集合,從而實(shí)現(xiàn)了獲得資源的多個(gè)標(biāo)簽的目的。本實(shí)施例中,所涉及的資源,可以是指網(wǎng)絡(luò)信息資源,是通過計(jì)算機(jī)網(wǎng)絡(luò)可以利用的各種信息資源的總和。具體地,可以是指所有以電子數(shù)據(jù)形式把文字、圖像、聲音、動(dòng)畫等多種形式的信息存儲在光、磁等非紙介質(zhì)的載體中,并通過網(wǎng)絡(luò)通信、計(jì)算機(jī)或終端等方式再現(xiàn)出來的資源。在一個(gè)優(yōu)選的實(shí)現(xiàn)過程中,所述資源可以為圖像。所謂的圖像,可以是指采用一定的圖像格式,將圖像數(shù)據(jù)即圖像的像素按照一定的方式進(jìn)行存儲,所形成的文件,又可以稱為圖像文件。其中,圖像的圖像格式即圖像存儲的格式,可以包括但不限于位圖(Bitmap,BMP)格式、可移植網(wǎng)絡(luò)圖像格式(PortableNetworkGraphicFormat,PNG)、聯(lián)合圖像專家組(JointPhotographicExpertsGroup,JPEG)格式、可交換圖像文件格式(ExchangeableImageFileFormat,EXIF),本 實(shí)施例對此不進(jìn)行特別限定。可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在101中,具體可以利用預(yù)先構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò),對所述資源進(jìn)行處理,以獲得所述資源的語義特征數(shù)據(jù)。在一個(gè)具體的實(shí)現(xiàn)過程中,還可以進(jìn)一步預(yù)先構(gòu)建一個(gè)卷積神經(jīng)網(wǎng)絡(luò)。具體地,具體可以根據(jù)標(biāo)簽在第一訓(xùn)練樣本集中的出現(xiàn)情況,對所述第一訓(xùn)練樣本集中每個(gè)第一訓(xùn)練樣本中所包含的至少一個(gè)標(biāo)簽進(jìn)行排序處理,以獲得所述第一每個(gè)訓(xùn)練樣本的樣本序列。然后,則可以根據(jù)所述第一每個(gè)訓(xùn)練樣本的樣本序列,構(gòu)建所述卷積神經(jīng)網(wǎng)絡(luò)。該卷積神經(jīng)網(wǎng)絡(luò),可以有效地表示出資源到語義特征數(shù)據(jù)之間的映射關(guān)系。所謂的卷積神經(jīng)網(wǎng)絡(luò)是一種使用卷積的前向神經(jīng)網(wǎng)絡(luò),可以有效的模擬人腦中圖像理解的過程,因此非常適合用來處理與理解圖像。例如,具體可以根據(jù)標(biāo)簽在第一訓(xùn)練樣本集中的出現(xiàn)次數(shù),按照從大到小的順序,對所述第一訓(xùn)練樣本集中每個(gè)第一訓(xùn)練樣本中所包含的至少一個(gè)標(biāo)簽進(jìn)行排序處理,以獲得所述第一每個(gè)訓(xùn)練樣本的樣本序列?;蛘?,具體可以根據(jù)標(biāo)簽在第一訓(xùn)練樣本集中的最近出現(xiàn)時(shí)間,按照從距離當(dāng)前時(shí)間最近到距離當(dāng)前時(shí)間最遠(yuǎn)的順序,對所述第一訓(xùn)練樣本集中每個(gè)第一訓(xùn)練樣本中所包含的至少一個(gè)標(biāo)簽進(jìn)行排序處理,以獲得所述第一每個(gè)訓(xùn)練樣本的樣本序列。需要說明的是,每個(gè)第一訓(xùn)練樣本集中所包含的第一訓(xùn)練樣本,可以為經(jīng)過標(biāo)注的已知樣本即標(biāo)注了標(biāo)簽的資源,這樣,可以直接利用這些已知樣本進(jìn)行訓(xùn)練,以構(gòu)建目標(biāo)卷積神經(jīng)網(wǎng)絡(luò);或者還可以一部分為經(jīng)過標(biāo)注的已知樣本,另一部分為沒有經(jīng)過標(biāo)注的未知樣本,那么,則可以先利用已知樣本進(jìn)行訓(xùn)練,以構(gòu)建初始卷積神經(jīng)網(wǎng)絡(luò),然后,再利用初始卷積神經(jīng)網(wǎng)絡(luò)對未知樣本進(jìn)行預(yù)測,以獲得標(biāo)簽分類結(jié)果,進(jìn)而則可以根據(jù)未知樣本的標(biāo)簽分類結(jié)果,對未知樣本進(jìn)行標(biāo)注,以形成已知樣本,作為新增加的已知樣本,利用新增加的已知樣本,以及原始的已知樣本重新進(jìn)行訓(xùn)練,以構(gòu)建新的卷 積神經(jīng)網(wǎng)絡(luò),直到所構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)或已知樣本滿足目標(biāo)卷積神經(jīng)網(wǎng)絡(luò)的截止條件為止,如分類準(zhǔn)確率大于或等于預(yù)先設(shè)置的準(zhǔn)確率閾值或已知樣本的數(shù)量大于或等于預(yù)先設(shè)置的數(shù)量閾值等,本實(shí)施例對此不進(jìn)行特別限定。此外,除了利用上述的卷積神經(jīng)網(wǎng)絡(luò)之外,還可以采用各種手動(dòng)設(shè)計(jì)的圖像特征,獲取所述資源的語義特征數(shù)據(jù),例如,尺度不變特征轉(zhuǎn)換(Scale-InvariantFeatureTransform,SIFT)、梯度方向直方圖(HistogramofOrientedGradients,HOG)。與卷積神經(jīng)網(wǎng)絡(luò)相比,這種方法存在如下缺陷:過程完全是手動(dòng)設(shè)計(jì),在實(shí)際應(yīng)用中需要仔細(xì)調(diào)整相關(guān)的參數(shù);在進(jìn)行圖像處理的過程中,損失了大量的圖像信息。因此,通過利用卷積神經(jīng)網(wǎng)絡(luò),使得能夠獲得更為準(zhǔn)確的資源的語義特征數(shù)據(jù),因此,能夠有效提高資源的語義特征數(shù)據(jù)獲取的可靠性??蛇x地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在102中,具體可以根據(jù)所述資源的語義特征數(shù)據(jù),利用預(yù)先構(gòu)建的遞歸神經(jīng)網(wǎng)絡(luò),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率。所謂的標(biāo)簽序列的后驗(yàn)概率,可以是指在得到結(jié)果的信息(即圖像和圖像的標(biāo)簽序列)后重新修正的概率。在一個(gè)具體的實(shí)現(xiàn)過程中,還可以進(jìn)一步預(yù)先構(gòu)建一個(gè)遞歸神經(jīng)網(wǎng)絡(luò)。具體地,具體可以根據(jù)標(biāo)簽在第二訓(xùn)練樣本集中的出現(xiàn)情況,對所述第二訓(xùn)練樣本集中每個(gè)第二訓(xùn)練樣本中所包含的至少一個(gè)標(biāo)簽進(jìn)行排序處理,以獲得所述每個(gè)第二訓(xùn)練樣本的樣本序列。以及獲取所述第二訓(xùn)練樣本集中每個(gè)第二訓(xùn)練樣本中所包含的一個(gè)資源的語義特征數(shù)據(jù)。然后,則可以根據(jù)所述每個(gè)第二訓(xùn)練樣本的樣本序列和所述每個(gè)第二訓(xùn)練樣本中所包含的一個(gè)資源的語義特征數(shù)據(jù),構(gòu)建所述遞歸神經(jīng)網(wǎng)絡(luò)。該遞歸神經(jīng)網(wǎng)絡(luò),可以有效表示出語義特征數(shù)據(jù)到標(biāo)簽序列間的相互關(guān)系之間的映射關(guān)系。所謂的遞歸神經(jīng)網(wǎng)絡(luò)是一種具有環(huán)路的神經(jīng)網(wǎng)絡(luò),可以通過更新其內(nèi)部的狀態(tài)來表示出時(shí)間序列的動(dòng)態(tài)特性,可以處理任意長度的序列,因此,非 常適合用來對序列數(shù)據(jù)(如本發(fā)明中的標(biāo)簽序列)中各個(gè)元素之間的關(guān)系進(jìn)行建模,例如,自然語音、語音、手寫識別等。此處構(gòu)建遞歸神經(jīng)網(wǎng)絡(luò)所采用的第二訓(xùn)練樣本集與之前構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)所采用的第一訓(xùn)練樣本集,可以是同一個(gè)訓(xùn)練樣本集,或者還可以分別是兩個(gè)不同的訓(xùn)練樣本集,本實(shí)施例對此不進(jìn)行特別限定。需要說明的是,每個(gè)第二訓(xùn)練樣本集中所包含的第二訓(xùn)練樣本,可以為經(jīng)過標(biāo)注的已知樣本即標(biāo)注了標(biāo)簽的資源,這樣,可以直接利用這些已知樣本進(jìn)行訓(xùn)練,以構(gòu)建目標(biāo)卷積神經(jīng)網(wǎng)絡(luò);或者還可以一部分為經(jīng)過標(biāo)注的已知樣本,另一部分為沒有經(jīng)過標(biāo)注的未知樣本,那么,則可以先利用已知樣本進(jìn)行訓(xùn)練,以構(gòu)建初始卷積神經(jīng)網(wǎng)絡(luò),然后,再利用初始卷積神經(jīng)網(wǎng)絡(luò)對未知樣本進(jìn)行預(yù)測,以獲得標(biāo)簽分類結(jié)果,進(jìn)而則可以根據(jù)未知樣本的標(biāo)簽分類結(jié)果,對未知樣本進(jìn)行標(biāo)注,以形成已知樣本,作為新增加的已知樣本,利用新增加的已知樣本,以及原始的已知樣本重新進(jìn)行訓(xùn)練,以構(gòu)建新的卷積神經(jīng)網(wǎng)絡(luò),直到所構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)或已知樣本滿足目標(biāo)卷積神經(jīng)網(wǎng)絡(luò)的截止條件為止,如分類準(zhǔn)確率大于或等于預(yù)先設(shè)置的準(zhǔn)確率閾值或已知樣本的數(shù)量大于或等于預(yù)先設(shè)置的數(shù)量閾值等,本實(shí)施例對此不進(jìn)行特別限定。此外,除了利用上述的卷積神經(jīng)網(wǎng)絡(luò)之外,還可以采用其他方法,對標(biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性等,進(jìn)行學(xué)習(xí),例如,條件隨機(jī)場模型、馬爾科夫場模型等基于模型的方法,這種方法只能表示出兩兩標(biāo)簽之間的關(guān)聯(lián)關(guān)系,并且學(xué)習(xí)過程的運(yùn)算速度較慢,再例如,將多個(gè)標(biāo)簽組合成一個(gè)標(biāo)簽的方法,等等,這種方法學(xué)習(xí)過程比較復(fù)雜,并且運(yùn)算亮較大,運(yùn)算速度慢。因此,通過利用遞歸神經(jīng)網(wǎng)絡(luò),使得能夠?qū)?biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性等表示出來,因此,能夠有效提高資源的標(biāo)簽獲得的可靠性。另外,通過構(gòu)建遞歸神經(jīng)網(wǎng)絡(luò),其學(xué)習(xí)過程的運(yùn)算量較小,使得能夠快速地學(xué)習(xí)標(biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性等, 因此,能夠有效提高標(biāo)簽序列的關(guān)聯(lián)關(guān)系學(xué)習(xí)的效率??蛇x地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在103中,具體可以根據(jù)所述后驗(yàn)概率,從所述資源的全部標(biāo)簽序列中,選擇后驗(yàn)概率最大的一個(gè)標(biāo)簽序列,作為所述一個(gè)標(biāo)簽序列??蛇x地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在103中,具體可以根據(jù)所述后驗(yàn)概率,從所述資源的部分標(biāo)簽序列中,選擇后驗(yàn)概率最大的一個(gè)標(biāo)簽序列,作為所述一個(gè)標(biāo)簽序列。在一個(gè)具體的實(shí)現(xiàn)過程中,可以進(jìn)一步預(yù)先設(shè)置一個(gè)概率閾值,在所獲得的所述資源的全部標(biāo)簽序列中,利用概率閾值,將后驗(yàn)概率小于該概率閾值的標(biāo)簽序列直接過濾掉,在剩下的標(biāo)簽序列中,選擇后驗(yàn)概率最大的一個(gè)標(biāo)簽序列,作為所述一個(gè)標(biāo)簽序列。本實(shí)施例中,通過獲取資源的語義特征數(shù)據(jù),進(jìn)而根據(jù)所述資源的語義特征數(shù)據(jù),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率,使得能夠根據(jù)所述后驗(yàn)概率,選擇一個(gè)標(biāo)簽序列,以作為所述資源的標(biāo)簽集合,從而實(shí)現(xiàn)了獲得資源的多個(gè)標(biāo)簽的目的。另外,采用本發(fā)明所提供的技術(shù)方案,由于考慮了標(biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性等,使得能夠獲得資源的一個(gè)標(biāo)簽序列,而不是分別采用單標(biāo)簽分類的方法,單獨(dú)地獲得資源的若干個(gè)相互獨(dú)立的標(biāo)簽,因此,能夠有效提高資源的標(biāo)簽獲得的可靠性。另外,采用本發(fā)明所提供的技術(shù)方案,通過利用卷積神經(jīng)網(wǎng)絡(luò),使得能夠獲得更為準(zhǔn)確的資源的語義特征數(shù)據(jù),因此,能夠有效提高資源的語義特征數(shù)據(jù)獲取的可靠性。另外,采用本發(fā)明所提供的技術(shù)方案,通過利用遞歸神經(jīng)網(wǎng)絡(luò),使得能夠?qū)?biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性等表示出來,因此,能夠有效提高資源的標(biāo)簽獲得的可靠性。另外,采用本發(fā)明所提供的技術(shù)方案,通過構(gòu)建遞歸神經(jīng)網(wǎng)絡(luò),使得能夠快速地學(xué)習(xí)標(biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性 等,因此,能夠有效提高標(biāo)簽序列的關(guān)聯(lián)關(guān)系學(xué)習(xí)的效率。需要說明的是,對于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。在上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。圖2為本發(fā)明另一實(shí)施例提供的標(biāo)簽的處理裝置的結(jié)構(gòu)示意圖,如圖2所示。本實(shí)施例的標(biāo)簽的處理裝置可以包括獲取單元21、處理單元22和選擇單元23。其中,獲取單元21,用于獲取資源的語義特征數(shù)據(jù);處理單元22,用于根據(jù)所述資源的語義特征數(shù)據(jù),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率;選擇單元23,用于根據(jù)所述后驗(yàn)概率,選擇一個(gè)標(biāo)簽序列,以作為所述資源的標(biāo)簽集合。需要說明的是,本實(shí)施例所提供的標(biāo)簽的處理裝置的部分或全部可以為位于本地終端的應(yīng)用,或者還可以為設(shè)置在位于本地終端的應(yīng)用中的插件或軟件開發(fā)工具包(SoftwareDevelopmentKit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)服務(wù)器中的處理引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實(shí)施例對此不進(jìn)行特別限定??梢岳斫獾氖?,所述應(yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個(gè)網(wǎng)頁程序(webApp),本實(shí)施例對此不進(jìn)行特別限定。本實(shí)施例中,所涉及的資源,可以是指網(wǎng)絡(luò)信息資源,是通過計(jì)算機(jī)網(wǎng)絡(luò)可以利用的各種信息資源的總和。具體地,可以是指所有以電子數(shù)據(jù)形式把文字、圖像、聲音、動(dòng)畫等多種形式的信息存儲在光、磁等非紙介質(zhì)的載體中,并通過網(wǎng)絡(luò)通信、計(jì)算機(jī)或終端等方式再現(xiàn)出來的資源。在一個(gè)優(yōu)選的實(shí)現(xiàn)過程中,所述資源可以為圖像。所謂的圖像,可以是 指采用一定的圖像格式,將圖像數(shù)據(jù)即圖像的像素按照一定的方式進(jìn)行存儲,所形成的文件,又可以稱為圖像文件。可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述獲取單元21,具體可以用于利用預(yù)先構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò),對所述資源進(jìn)行處理,以獲得所述資源的語義特征數(shù)據(jù)。在一個(gè)具體的實(shí)現(xiàn)過程中,所述獲取單元21,還可以進(jìn)一步用于根據(jù)標(biāo)簽在第一訓(xùn)練樣本集中的出現(xiàn)情況,對所述第一訓(xùn)練樣本集中每個(gè)第一訓(xùn)練樣本中所包含的至少一個(gè)標(biāo)簽進(jìn)行排序處理,以獲得所述第一每個(gè)訓(xùn)練樣本的樣本序列;以及根據(jù)所述第一每個(gè)訓(xùn)練樣本的樣本序列,構(gòu)建所述卷積神經(jīng)網(wǎng)絡(luò)??蛇x地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述處理單元22,具體可以用于根據(jù)所述資源的語義特征數(shù)據(jù),利用預(yù)先構(gòu)建的遞歸神經(jīng)網(wǎng)絡(luò),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率。在一個(gè)具體的實(shí)現(xiàn)過程中,所述處理單元22,還可以進(jìn)一步用于根據(jù)標(biāo)簽在第二訓(xùn)練樣本集中的出現(xiàn)情況,對所述第二訓(xùn)練樣本集中每個(gè)第二訓(xùn)練樣本中所包含的至少一個(gè)標(biāo)簽進(jìn)行排序處理,以獲得所述每個(gè)第二訓(xùn)練樣本的樣本序列;獲取所述第二訓(xùn)練樣本集中每個(gè)第二訓(xùn)練樣本中所包含的一個(gè)資源的語義特征數(shù)據(jù);以及根據(jù)所述每個(gè)第二訓(xùn)練樣本的樣本序列和所述每個(gè)第二訓(xùn)練樣本中所包含的一個(gè)資源的語義特征數(shù)據(jù),構(gòu)建所述遞歸神經(jīng)網(wǎng)絡(luò)。可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述選擇單元23,具體可以用于根據(jù)所述后驗(yàn)概率,從所述資源的全部標(biāo)簽序列中,選擇所述一個(gè)標(biāo)簽序列??蛇x地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述選擇單元23,具體可以用于根據(jù)所述后驗(yàn)概率,從所述資源的部分標(biāo)簽序列中,選擇所述一個(gè)標(biāo)簽序列。需要說明的是,圖1對應(yīng)的實(shí)施例中方法,可以由本實(shí)施例提供的標(biāo)簽 的處理裝置實(shí)現(xiàn)。詳細(xì)描述可以參見圖1對應(yīng)的實(shí)施例中的關(guān)聯(lián)資源,此處不再贅述。本實(shí)施例中,通過獲取單元獲取資源的語義特征數(shù)據(jù),進(jìn)而由處理單元根據(jù)所述資源的語義特征數(shù)據(jù),獲得所述資源的至少一個(gè)標(biāo)簽序列的后驗(yàn)概率,使得選擇單元能夠根據(jù)所述后驗(yàn)概率,選擇一個(gè)標(biāo)簽序列,以作為所述資源的標(biāo)簽集合,從而實(shí)現(xiàn)了獲得資源的多個(gè)標(biāo)簽的目的。另外,采用本發(fā)明所提供的技術(shù)方案,由于考慮了標(biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性等,使得能夠獲得資源的一個(gè)標(biāo)簽序列,而不是分別采用單標(biāo)簽分類的方法,單獨(dú)地獲得資源的若干個(gè)相互獨(dú)立的標(biāo)簽,因此,能夠有效提高資源的標(biāo)簽獲得的可靠性。另外,采用本發(fā)明所提供的技術(shù)方案,通過利用卷積神經(jīng)網(wǎng)絡(luò),使得能夠獲得更為準(zhǔn)確的資源的語義特征數(shù)據(jù),因此,能夠有效提高資源的語義特征數(shù)據(jù)獲取的可靠性。另外,采用本發(fā)明所提供的技術(shù)方案,通過利用遞歸神經(jīng)網(wǎng)絡(luò),使得能夠?qū)?biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性等表示出來,因此,能夠有效提高資源的標(biāo)簽獲得的可靠性。另外,采用本發(fā)明所提供的技術(shù)方案,通過構(gòu)建遞歸神經(jīng)網(wǎng)絡(luò),使得能夠快速地學(xué)習(xí)標(biāo)簽序列中每個(gè)標(biāo)簽之間的關(guān)聯(lián)關(guān)系,例如,相關(guān)性、共線性等,因此,能夠有效提高標(biāo)簽序列的關(guān)聯(lián)關(guān)系學(xué)習(xí)的效率。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對應(yīng)過程,在此不再贅述。在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間 的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲在一個(gè)計(jì)算機(jī)可讀取存儲介質(zhì)中。上述軟件功能單元存儲在一個(gè)存儲介質(zhì)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲器(Read-OnlyMemory,ROM)、隨機(jī)存取存儲器(RandomAccessMemory,RAM)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。當(dāng)前第1頁1 2 3 當(dāng)前第1頁1 2 3