本發(fā)明涉及數(shù)據(jù)處理,更具體地說,本發(fā)明涉及一種基于大數(shù)據(jù)分析的精準(zhǔn)匹配招聘系統(tǒng)。
背景技術(shù):
1、隨著企業(yè)規(guī)模的擴(kuò)大和行業(yè)競(jìng)爭(zhēng)的加劇,招聘過程變得愈發(fā)復(fù)雜和耗時(shí),特別是在涉及大規(guī)模招聘和多崗位招聘時(shí),傳統(tǒng)的招聘流程通常依賴于人力資源部門的手動(dòng)篩選,這不僅耗時(shí)耗力,而且很難實(shí)現(xiàn)高效和精確的人崗匹配,特別是在大規(guī)模招聘活動(dòng)中;而且傳統(tǒng)招聘方法往往無法有效識(shí)別和處理多個(gè)職能相近崗位的招聘信息,導(dǎo)致簡(jiǎn)歷篩選重復(fù)、人員面試重復(fù)等問題,不僅浪費(fèi)了企業(yè)的時(shí)間和資源,也降低了招聘的效率和準(zhǔn)確性。
2、在人力資源管理中,如何在海量的求職者中快速、準(zhǔn)確地匹配出最適合崗位需求的候選人,成為企業(yè)提升招聘效率和競(jìng)爭(zhēng)力的關(guān)鍵;然而,現(xiàn)有的基于大數(shù)據(jù)分析的招聘系統(tǒng)大多集中在提高簡(jiǎn)歷匹配率上,而在面對(duì)大規(guī)模招聘、多個(gè)職能相近崗位的情況下,這些系統(tǒng)往往顯得力不從心,無法有效解決簡(jiǎn)歷重復(fù)篩選、候選人重復(fù)面試的問題;同時(shí),現(xiàn)有技術(shù)缺乏智能化的手段來精確識(shí)別和匹配多個(gè)崗位與候選人之間的關(guān)系,難以滿足企業(yè)對(duì)高效、精準(zhǔn)招聘的迫切需求。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的上述缺陷,本發(fā)明的實(shí)施例提供基于大數(shù)據(jù)分析的精準(zhǔn)匹配招聘系統(tǒng)。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種基于大數(shù)據(jù)分析的精準(zhǔn)匹配招聘系統(tǒng),所述系統(tǒng)包括:
4、特征篩選模塊,用于加載企業(yè)所有招聘崗位的描述文檔,利用tf-idf方法從描述文檔中篩選出共有詞集和每個(gè)招聘崗位的特有詞集;所述共有詞集包含p個(gè)共有詞,所述特有詞集包含q個(gè)特有詞,p、q∈n+,n+為正整數(shù);
5、崗位篩選模塊,用于依據(jù)共有詞集從所有招聘崗位中篩選出目標(biāo)崗位集;所述目標(biāo)崗位集中包含k個(gè)崗位職能趨近的目標(biāo)崗位,k∈n+,n+為正整數(shù);
6、匹配判斷模塊,用于調(diào)取求職者的待匹配簡(jiǎn)歷以及待匹配簡(jiǎn)歷中的關(guān)鍵詞集,以及提取目標(biāo)崗位的共有詞集和特有詞集,將關(guān)鍵詞集、共有詞集和特有詞集輸入至預(yù)訓(xùn)練好用于判斷人崗匹配是否一致的卷積神經(jīng)網(wǎng)絡(luò)中,得到判斷結(jié)果;所述判斷結(jié)果包括待匹配簡(jiǎn)歷與目標(biāo)崗位不適配,或待匹配簡(jiǎn)歷與目標(biāo)崗位相適配中的一種;所述關(guān)鍵詞集包含l個(gè)關(guān)鍵詞,l∈n+,n+為正整數(shù);
7、人崗匹配模塊,用于根據(jù)判斷結(jié)果從目標(biāo)崗位集中歸納出所有與求職者相適配的崗位合集;所述崗位合集中包含與求職者相適配的r個(gè)匹配崗位,r∈n+,n+為正整數(shù)。
8、進(jìn)一步地,在篩選出每個(gè)招聘崗位的共有詞集和特有詞集之前,包括:
9、a1:對(duì)所有招聘崗位的描述文檔進(jìn)行分詞處理,并在剔除無實(shí)義字符,得到s個(gè)預(yù)處理后的描述文檔,在每個(gè)預(yù)處理后的描述文檔中包括m個(gè)詞組,s、m∈n+,n+為正整數(shù);
10、a2:提取第i個(gè)預(yù)處理后的描述文檔中的第j詞組,i、j∈n+,n+為正整數(shù);
11、a3:將第j詞組輸入預(yù)訓(xùn)練好用于預(yù)測(cè)信息增益的決策樹模型中,以獲取第j詞組的信息增益值;
12、a4:將第j詞組的信息增益值與預(yù)設(shè)的信息增益值閾值進(jìn)行比對(duì),若信息增益值小于等于信息增益值閾值,則將第j詞組從第i個(gè)預(yù)處理后的描述文檔中剔除,并令i=i+1,并返回步驟a2;若信息增益值大于信息增益值閾值,則保留第i個(gè)預(yù)處理后的描述文檔中的第j詞組,并令i=i+1,并返回步驟a2;
13、a5:重復(fù)上述步驟a2~a4,直至i=m時(shí),結(jié)束循環(huán),得到第i個(gè)更新后的描述文檔,所述更新后的描述文檔中包含n個(gè)詞組,并令j=j+1,并返回步驟a2;n≤m,n∈n+,n+為正整數(shù);
14、a6:重復(fù)上述步驟a2~a5,直至j=s時(shí),結(jié)束循環(huán),得到s個(gè)更新后的描述文檔。
15、進(jìn)一步地,所述用于預(yù)測(cè)信息增益的決策樹模型的訓(xùn)練邏輯如下:
16、獲取歷史信息增益值訓(xùn)練數(shù)據(jù),將歷史信息增益值訓(xùn)練數(shù)據(jù)劃分為信息增益值訓(xùn)練集和信息增益值測(cè)試集;所述歷史信息增益值訓(xùn)練數(shù)據(jù)包括多個(gè)向量形式的詞組及其對(duì)應(yīng)的信息增益值;
17、構(gòu)建決策樹網(wǎng)絡(luò),將信息增益值訓(xùn)練集中向量形式的詞組作為決策樹網(wǎng)絡(luò)的輸入,以及將信息增益值訓(xùn)練集中的信息增益值作為決策樹網(wǎng)絡(luò)的輸出,對(duì)決策樹網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到初始化的決策樹回歸網(wǎng)絡(luò);
18、利用信息增益值測(cè)試集對(duì)初始化的決策樹回歸網(wǎng)絡(luò)進(jìn)行模型驗(yàn)證,輸出小于等于預(yù)設(shè)誤差閾值的初始化的決策樹回歸網(wǎng)絡(luò),作為用于預(yù)測(cè)信息增益的決策樹模型。
19、進(jìn)一步地,所述歷史信息增益值訓(xùn)練數(shù)據(jù)中的信息增益值,通過信息增益度量方法處理得到;
20、其中,所述信息增益度量方法的處理邏輯如下:
21、獲取歷史崗位匹配樣本數(shù)據(jù),所述歷史崗位匹配樣本數(shù)據(jù)包括u個(gè)崗位匹配樣本,在每個(gè)崗位匹配樣本中均包括多個(gè)特征詞及其對(duì)應(yīng)的分類標(biāo)簽(目標(biāo)變量),所述分類標(biāo)簽(目標(biāo)變量)包括匹配和不匹配,u∈n+,n+為正整數(shù);
22、根據(jù)u個(gè)崗位匹配樣本計(jì)算初始熵,其具體計(jì)算公式如下:
23、;
24、式中:表示初始熵,表示分類標(biāo)簽(目標(biāo)變量)的類別數(shù)量,表示第r個(gè)類別分類標(biāo)簽(目標(biāo)變量)的概率;
25、計(jì)算特征詞的條件熵,其具體計(jì)算公式如下:
26、;
27、式中:表示條件熵,表示包含特征詞的可能取值數(shù)量,表示包含特征詞取值為的條件概率,表示包含特征詞取值為時(shí),分類標(biāo)簽(目標(biāo)變量)的熵;
28、計(jì)算信息增益值,其具體計(jì)算公式如下:
29、;
30、式中:表示信息增益值。
31、進(jìn)一步地,所述從描述文檔中篩選出共有詞集,包括:
32、獲取更新后的描述文檔中的每個(gè)詞組,并計(jì)算每個(gè)詞組的df值;
33、提取df值大于等于預(yù)設(shè)df閾值的對(duì)應(yīng)詞組,將df值大于等于預(yù)設(shè)df閾值的對(duì)應(yīng)詞組標(biāo)記為共有詞,得到p個(gè)共有詞,并將p個(gè)共有詞融合為共有詞集。
34、進(jìn)一步地,所述從描述文檔中篩選出每個(gè)招聘崗位的特有詞集,包括:
35、b1:提取第g個(gè)招聘崗位對(duì)應(yīng)更新后的描述文檔;并計(jì)算更新后的描述文檔中每個(gè)詞組的tf-idf值,g∈n+,n+為正整數(shù);
36、b2:將每個(gè)詞組的tf-idf值與預(yù)設(shè)tf-idf閾值進(jìn)行比對(duì),若tf-idf值大于等于預(yù)設(shè)tf-idf閾值,則將對(duì)應(yīng)的詞組標(biāo)記為特有詞;若tf-idf值大小于預(yù)設(shè)tf-idf閾值,則令g=g+1,并返回步驟b1;
37、b3:統(tǒng)計(jì)第g個(gè)招聘崗位的所有特有詞,得到第g個(gè)招聘崗位的q個(gè)特有詞,將第g個(gè)招聘崗位的q個(gè)特有詞融合為特有詞集,則得到第g個(gè)招聘崗位的特有詞集,并令g=g+1,并返回步驟b1;
38、b4:重復(fù)上述步驟b1~b3,直至所有招聘崗位被篩選時(shí),結(jié)束循環(huán),得到每個(gè)招聘崗位的特有詞集。
39、進(jìn)一步地,所述從所有招聘崗位中篩選出目標(biāo)崗位集,包括:
40、提取所有招聘崗位更新后的描述文檔,并提取更新后的描述文檔中共有詞的出現(xiàn)數(shù)量;
41、將共有詞的出現(xiàn)數(shù)量與預(yù)設(shè)出現(xiàn)數(shù)量閾值進(jìn)行比對(duì),若出現(xiàn)數(shù)量與大于等于預(yù)設(shè)出現(xiàn)數(shù)量閾值,則將更新后的描述文檔對(duì)應(yīng)的招聘崗位,標(biāo)記為崗位職能趨近的目標(biāo)崗位;若出現(xiàn)數(shù)量與小于預(yù)設(shè)出現(xiàn)數(shù)量閾值,則將更新后的描述文檔對(duì)應(yīng)的招聘崗位,標(biāo)記為非目標(biāo)崗位;
42、統(tǒng)計(jì)所有出現(xiàn)數(shù)量與大于等于預(yù)設(shè)出現(xiàn)數(shù)量閾值的對(duì)應(yīng)招聘崗位,得到k個(gè)崗位職能趨近的目標(biāo)崗位,并將k個(gè)崗位職能趨近的目標(biāo)崗位融合為目標(biāo)崗位集。
43、進(jìn)一步地,所述用于判斷人崗匹配是否一致的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練邏輯如下:
44、獲取歷史人崗匹配訓(xùn)練數(shù)據(jù),將歷史人崗匹配訓(xùn)練數(shù)據(jù)劃分為人崗匹配訓(xùn)練集和人崗匹配測(cè)試集,所述歷史人崗匹配訓(xùn)練數(shù)據(jù)包括人崗匹配特征數(shù)據(jù)及其對(duì)應(yīng)的標(biāo)注標(biāo)簽;
45、其中,所述人崗匹配特征數(shù)據(jù)包括待匹配簡(jiǎn)歷中的關(guān)鍵詞集、目標(biāo)崗位的共有詞集和特有詞集;所述標(biāo)注標(biāo)簽包括“0”和“1”,其中,“0”表示待匹配簡(jiǎn)歷與目標(biāo)崗位不適配,“1”表示待匹配簡(jiǎn)歷與目標(biāo)崗位相適配;
46、其中,所述歷史人崗匹配訓(xùn)練數(shù)據(jù)中標(biāo)注標(biāo)簽的生成邏輯如下:
47、將待匹配簡(jiǎn)歷的關(guān)鍵詞集與目標(biāo)崗位的共有詞集進(jìn)行相似度計(jì)算,得到第一相似度;
48、將待匹配簡(jiǎn)歷的關(guān)鍵詞集與目標(biāo)崗位的特有詞集進(jìn)行相似度計(jì)算,得到第二相似度;
49、將第一相似度和第二相似度代入預(yù)構(gòu)建的數(shù)學(xué)計(jì)算模型中,得到待匹配簡(jiǎn)歷與目標(biāo)崗位的匹配系數(shù);
50、其中,所述數(shù)學(xué)計(jì)算模型的表達(dá)式如下:
51、;
52、式中:表示待匹配簡(jiǎn)歷與目標(biāo)崗位的匹配系數(shù),表示第一相似度,表示第二相似度,和表示大于零的權(quán)重因子,;
53、將匹配系數(shù)與預(yù)設(shè)的匹配系數(shù)閾值進(jìn)行比對(duì),若匹配系數(shù)大于等于匹配系數(shù)閾值,則判定待匹配簡(jiǎn)歷與對(duì)應(yīng)的目標(biāo)崗位相適配;若匹配系數(shù)小于匹配系數(shù)閾值,則判定待匹配簡(jiǎn)歷與對(duì)應(yīng)的目標(biāo)崗位不適配;
54、構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),將人崗匹配訓(xùn)練集中人崗匹配特征數(shù)據(jù)作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,以及將人崗匹配訓(xùn)練集中的標(biāo)注標(biāo)簽作為卷積神經(jīng)網(wǎng)絡(luò)的輸出,對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到初始卷積神經(jīng)網(wǎng)絡(luò);
55、利用人崗匹配測(cè)試集對(duì)初始卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行模型驗(yàn)證,輸出大于等于預(yù)設(shè)測(cè)試準(zhǔn)確度的初始卷積神經(jīng)網(wǎng)絡(luò),作為用于判斷人崗匹配是否一致的卷積神經(jīng)網(wǎng)絡(luò)。
56、進(jìn)一步地,所述從目標(biāo)崗位集中歸納出所有與求職者相適配的崗位合集,包括:
57、統(tǒng)計(jì)目標(biāo)崗位集中所有與待匹配簡(jiǎn)歷相適配的目標(biāo)崗位;
58、將所有與待匹配簡(jiǎn)歷相適配的目標(biāo)崗位,標(biāo)記與求職者相適配的匹配崗位,得到r個(gè)匹配崗位。
59、一種基于大數(shù)據(jù)分析的精準(zhǔn)匹配招聘方法,根據(jù)上述所述的基于大數(shù)據(jù)分析的精準(zhǔn)匹配招聘系統(tǒng)實(shí)現(xiàn),所述方法包括:
60、加載企業(yè)所有招聘崗位的描述文檔,利用tf-idf方法從描述文檔中篩選出共有詞集和每個(gè)招聘崗位的特有詞集;所述共有詞集包含p個(gè)共有詞,所述特有詞集包含q個(gè)特有詞,p、q∈n+,n+為正整數(shù);
61、依據(jù)共有詞集從所有招聘崗位中篩選出目標(biāo)崗位集;所述目標(biāo)崗位集中包含k個(gè)崗位職能趨近的目標(biāo)崗位,k∈n+,n+為正整數(shù);
62、調(diào)取求職者的待匹配簡(jiǎn)歷以及待匹配簡(jiǎn)歷中的關(guān)鍵詞集,以及提取目標(biāo)崗位的共有詞集和特有詞集,將關(guān)鍵詞集、共有詞集和特有詞集輸入至預(yù)訓(xùn)練好用于判斷人崗匹配是否一致的卷積神經(jīng)網(wǎng)絡(luò)中,得到判斷結(jié)果;所述判斷結(jié)果包括待匹配簡(jiǎn)歷與目標(biāo)崗位不適配,或待匹配簡(jiǎn)歷與目標(biāo)崗位相適配中的一種;所述關(guān)鍵詞集包含l個(gè)關(guān)鍵詞,l∈n+,n+為正整數(shù);
63、根據(jù)判斷結(jié)果從目標(biāo)崗位集中歸納出所有與求職者相適配的崗位合集;所述崗位合集中包含與求職者相適配的r個(gè)匹配崗位,r∈n+,n+為正整數(shù)。
64、相比于現(xiàn)有技術(shù),本發(fā)明的有益效果在于:
65、(1)本技術(shù)公開了一種基于大數(shù)據(jù)分析的精準(zhǔn)匹配招聘系統(tǒng),包括:加載企業(yè)所有招聘崗位的描述文檔,利用tf-idf方法從描述文檔中篩選出共有詞集和每個(gè)招聘崗位的特有詞集;依據(jù)共有詞集從所有招聘崗位中篩選出目標(biāo)崗位集;調(diào)取求職者的待匹配簡(jiǎn)歷以及待匹配簡(jiǎn)歷中的關(guān)鍵詞集,以及提取目標(biāo)崗位的共有詞集和特有詞集,將關(guān)鍵詞集、共有詞集和特有詞集輸入至預(yù)訓(xùn)練好用于判斷人崗匹配是否一致的卷積神經(jīng)網(wǎng)絡(luò)中,得到判斷結(jié)果;根據(jù)判斷結(jié)果從目標(biāo)崗位集中歸納出所有與求職者相適配的崗位合集;基于上述內(nèi)容,本發(fā)明能自動(dòng)化處理多個(gè)職能相近的崗位,避免了簡(jiǎn)歷的重復(fù)篩選和候選人的重復(fù)面試,顯著減少了人力資源管理中的冗余工作;相比傳統(tǒng)的“一對(duì)一”招聘方式,本系統(tǒng)能夠一次性處理多個(gè)崗位的需求,大大提高了招聘流程的效率和速度。
66、(2)本技術(shù)公開了一種基于大數(shù)據(jù)分析的精準(zhǔn)匹配招聘系統(tǒng),通過加快招聘流程并確保匹配精度,企業(yè)能夠更快地找到合適的員工,縮短招聘周期,適合于大規(guī)模企業(yè)的多崗位招聘需求,能夠有效處理多個(gè)招聘部門的不同需求,確保企業(yè)能夠迅速獲取所需的人才;此外,通過減少簡(jiǎn)歷重復(fù)篩選和面試次數(shù),大大節(jié)省了招聘時(shí)間和人力資源成本。