本發(fā)明涉及電子技術(shù)領(lǐng)域,尤其涉及一種電信詐騙識別方法及數(shù)據(jù)處理設(shè)備。
背景技術(shù):
近年來,隨著我國金融、通信業(yè)的快速發(fā)展,借助移動手機、固定電話、互聯(lián)網(wǎng)等電信工具進行金融詐騙等類型的犯罪案件頻發(fā),給人民群眾財產(chǎn)造成了巨大的損失,極大擾亂了社會秩序。而且,電信詐騙活動越來越呈現(xiàn)信息化和智能化的趨勢,尤其是偽基站、網(wǎng)絡(luò)改號軟件、釣魚網(wǎng)址、木馬病毒等高科技手段的非法使用,使得案件調(diào)查、嫌犯控制、贓款追繳的極其困難。
目前,針對如何有效識別電信詐騙活動,業(yè)內(nèi)各界人士進行了積極地探索,提出并實施了一些解決方案。其中,現(xiàn)有的主流解決方案中,一種方案是:針對詐騙行為本身進行的單環(huán)節(jié)、靜態(tài)的詐騙防范手段,即將詐騙者的電話號碼、語音等內(nèi)容與已有的詐騙事件數(shù)據(jù)庫中的相關(guān)內(nèi)容進行匹配以確定詐騙事件。例如,電子設(shè)備通過聲紋認證、語音識別、自然語言理解等技術(shù),將收到的來電號碼、語音信息等內(nèi)容與詐騙信息數(shù)據(jù)庫中的黑名單信息進行匹配分析,從而識別出可疑的詐騙事件。然而,隨著偽基站、網(wǎng)絡(luò)改號軟件等方式的非法應(yīng)用,來電號碼、語音內(nèi)容等被詐騙者預(yù)先進行了偽造處理,使得對來電號碼、語音內(nèi)容等進行黑名單信息的匹配失去了意義,從而導(dǎo)致電信詐騙識別率較低;另一種方案是:電子設(shè)備結(jié)合自身的數(shù)據(jù)庫對用戶收到的短信、語音及其它通信內(nèi)容中的關(guān)鍵字進行匹配,以判別短信、語音及其它通信信息是否為詐騙信息,但隨著詐騙者的詐騙手段和行為不斷演進,僅僅針對關(guān)鍵詞進行匹配分析的電信詐騙識別技術(shù)很難有效的洞察出詐騙事件,使得電信詐騙識別率較低。
綜上,現(xiàn)有技術(shù)中存在電子設(shè)備對詐騙事件的識別率較低的技術(shù)問題。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供一種電信詐騙識別方法及數(shù)據(jù)處理設(shè)備,用以解決現(xiàn)有技術(shù)中存在的電子設(shè)備對詐騙事件的識別率較低的技術(shù)問題。
一方面,本發(fā)明實施例提供一種電信詐騙識別方法,應(yīng)用于數(shù)據(jù)處理設(shè)備,包括:
獲取來自與所述數(shù)據(jù)處理設(shè)備連接的終端設(shè)備的用戶行為信息,所述用戶行為信息用于指示第一用戶針對所述終端設(shè)備中的待評估信息進行的操作行為;基于至少一個評估指標對所述用戶行為信息進行處理,獲得評估概率;其中,所述至少一個評估指標為基于歷史詐騙事件確定的、用于表征所述第一用戶對所述歷史詐騙事件的敏感度,所述評估概率用于表征所述用戶行為信息所指示的操作與所述歷史詐騙事件相關(guān)的歷史操作的匹配度;若所述評估概率大于預(yù)設(shè)概率,確定所述待評估信息為電信詐騙信息。
可選的,在基于至少一個評估指標對所述用戶行為信息進行處理,獲得評估概率之前,所述方法還包括:確定多個歷史詐騙事件;獲取所述多個歷史詐騙事件中每個歷史詐騙事件相關(guān)的詐騙信息和用戶信息,所述詐騙信息指示了相應(yīng)歷史詐騙事件的詐騙行為;對所述詐騙信息和所述用戶信息進行處理,確定用于指示所述多個歷史詐騙事件中每個歷史詐騙事件的事件特征的第一評估指標,及用于指示所述多個用戶中每個用戶受到詐騙的難易程度的第二評估指標。
可選的,所述基于至少一個評估指標對所述用戶行為信息進行處理,獲得評估概率,包括:基于所述第一評估指標及所述用戶行為信息,確定用于表征所述第一用戶的用戶行為信息對應(yīng)的用戶操作與所述詐騙信息指示的詐騙行為之間的相似度的第一參考值,及,基于所述第二評估指標及所述用戶行為信息,確定用于表征所述第一用戶的當前操作相對于所述第一用戶針對所述歷史詐騙事件的歷史操作的傾向度的第二參考值;基于所述第一參考值和/或所述第二參考值,獲得評估概率。
可選的,所述基于所述第一參考值和/或所述第二參考值,獲得評估概率,包括:設(shè)置至少一個權(quán)重,所述至少一個權(quán)重包括與所述第一參考值對應(yīng)的第一權(quán)重,和/或與所述第二參考值對應(yīng)的第二權(quán)重;基于所述第一參考值、所述第二參考值及所述至少一個權(quán)重,確定所述評估概率。
可選的,在若所述評估概率大于預(yù)設(shè)概率,確定所述待評估信息為電信詐騙信息之后,所述方法還包括:基于所述電信詐騙信息,確定與所述用戶行為信息相關(guān)的提示信息,所述提示信息用于提示用戶對所述電信詐騙信息進行處理;通過所述數(shù)據(jù)處理設(shè)備或者與所述數(shù)據(jù)處理設(shè)備相連的第三方輔助設(shè)備輸出所述提示信息。
另一方面,本發(fā)明實施例提供一種數(shù)據(jù)處理設(shè)備,包括:
第一獲取模塊,用于獲取來自與所述數(shù)據(jù)處理設(shè)備連接的終端設(shè)備的用戶行為信息,所述用戶行為信息用于指示第一用戶針對所述終端設(shè)備中的待評估信息進行的操作行為;第一處理模塊,用于基于至少一個評估指標對所述用戶行為信息進行處理,獲得評估概率;其中,所述至少一個評估指標為基于歷史詐騙事件確定的、用于表征所述第一用戶對所述歷史詐騙事件的敏感度,所述評估概率用于表征所述用戶行為信息所指示的操作與所述歷史詐騙事件相關(guān)的歷史操作的匹配度;第一確定模塊,用于若所述評估概率大于預(yù)設(shè)概率,確定所述待評估信息為電信詐騙信息。
可選的,所述數(shù)據(jù)處理設(shè)備還包括:第二確定模塊,用于確定多個歷史詐騙事件;第二獲取模塊,用于獲取所述多個歷史詐騙事件中每個歷史詐騙事件相關(guān)的詐騙信息和用戶信息,所述詐騙信息指示了相應(yīng)歷史詐騙事件的詐騙行為;第二處理模塊,用于對所述詐騙信息和所述用戶信息進行處理,確定用于指示所述多個歷史詐騙事件中每個歷史詐騙事件的事件特征的第一評估指標,及用于指示所述多個用戶中每個用戶受到詐騙的難易程度的第二評估指標。
可選的,所述第一處理模塊用于:基于所述第一評估指標及所述用戶行為信息,確定用于表征所述第一用戶的用戶行為信息對應(yīng)的用戶操作與所述詐騙信息指示的詐騙行為之間的相似度的第一參考值,及,基于所述第二評估指標及所述用戶行為信息,確定用于表征所述第一用戶的當前操作相對于所述第一用戶針對所述歷史詐騙事件的歷史操作的傾向度的第二參考值;基于所述第一參考值和/或所述第二參考值,獲得評估概率。
可選的,所述第一處理模塊用于:設(shè)置至少一個權(quán)重,所述至少一個權(quán)重包括與所述第一參考值對應(yīng)的第一權(quán)重,和/或與所述第二參考值對應(yīng)的第二權(quán)重;基于所述第一參考值、所述第二參考值及所述至少一個權(quán)重,確定所述評估概率。
可選的,所述數(shù)據(jù)處理設(shè)備還包括:第三確定模塊,用于在若所述評估概率大于預(yù)設(shè)概率,確定所述待評估信息為電信詐騙信息之后,基于所述電信詐騙信息,確定與所述用戶行為信息相關(guān)的提示信息,所述提示信息用于提示用戶對所述電信詐騙信息進行處理;輸出模塊,用于通過所述數(shù)據(jù)處理設(shè)備或者與所述數(shù)據(jù)處理設(shè)備相連的第三方輔助設(shè)備輸出所述提示信息。
上述技術(shù)方案中的一個或多個技術(shù)方案,具有如下技術(shù)效果或優(yōu)點:
本發(fā)明實施例中,數(shù)據(jù)處理設(shè)備通過獲取來自與其連接的終端設(shè)備的用戶行為信息,該用戶行為信息用于指示第一用戶針對終端設(shè)備中的待評估信息進行的操作行為,進而,基于至少一個評估指標對用戶行為信息進行處理,獲得相應(yīng)的評估概率,其中,至少一個評估指標為基于歷史詐騙事件確定的、用于表征第一用戶對歷史詐騙事件的敏感度,評估概率用于表征用戶行為信息所指示的操作與歷史詐騙事件相關(guān)的歷史操作的匹配度;若評估概率大于預(yù)設(shè)概率,確定待評估信息為電信詐騙信息,因此,通過基于歷史詐騙事件確定的、用于表征第一用戶對歷史詐騙事件的敏感度的至少一個評估指標對用戶行為信息進行處理,使得數(shù)據(jù)處理設(shè)備可以更準確地判別用戶遭受詐騙的可能性,從而解決了電子設(shè)備對詐騙事件的識別率較低的技術(shù)問題,實現(xiàn)提升識別詐騙行為的準確性的技術(shù)效果。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例中電信詐騙識別方法的流程圖;
圖2為本發(fā)明實施例中數(shù)據(jù)處理設(shè)備的模塊示意圖。
具體實施方式
為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明實施例中,數(shù)據(jù)處理設(shè)備可以是具有數(shù)據(jù)采集功能,并可以利用數(shù)據(jù)挖掘等技術(shù)對采集的數(shù)據(jù)進行大數(shù)據(jù)處理的設(shè)備,如遠端數(shù)據(jù)采集器、無線數(shù)據(jù)采集器、網(wǎng)頁數(shù)據(jù)采集器等,數(shù)據(jù)處理設(shè)備具體為哪種設(shè)備可以與實際中的應(yīng)用相關(guān),本發(fā)明實施例不作任何限制。
相應(yīng)地,本發(fā)明實施例中,數(shù)據(jù)處理設(shè)備可以連接有多個終端設(shè)備,其中終端設(shè)備可以是手機、電腦、傳感設(shè)備等等。在實際應(yīng)用中,終端設(shè)備可以通過有線方式,如采用同軸電纜、雙絞線、光纖等與數(shù)據(jù)處理設(shè)備進行有線連接,或者,終端設(shè)備也可以通過無線方式,如無線保真(wireless-fidelity,wi-fi)、藍牙等無線網(wǎng)絡(luò)與數(shù)據(jù)處理設(shè)備進行無線連接,以接收或者發(fā)送相關(guān)信息。
另外,本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,a和/或b,可以表示:單獨存在a,同時存在a和b,單獨存在b這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。
下面結(jié)合附圖對本發(fā)明優(yōu)選的實施方式進行詳細的說明。
請參見圖1,本發(fā)明實施例提供一種電信詐騙識別方法,可以應(yīng)用于數(shù)據(jù)處理設(shè)備,該方法的過程可以描述如下:
s100:獲取來自與數(shù)據(jù)處理設(shè)備連接的終端設(shè)備的用戶行為信息,該用戶行為信息用于指示第一用戶針對終端設(shè)備中的待評估信息進行的操作行為;
s200:基于至少一個評估指標對用戶行為信息進行處理,獲得評估概率;其中,至少一個評估指標為基于歷史詐騙事件確定的、用于表征第一用戶對歷史詐騙事件的敏感度,評估概率用于表征用戶行為信息所指示的操作與歷史詐騙事件相關(guān)的歷史操作的匹配度;
s300:若評估概率大于預(yù)設(shè)概率,確定待評估信息為電信詐騙信息。
s100中,用戶行為信息可以為用戶針對終端設(shè)備進行的行為信息,如用戶通過手機進行撥號、收發(fā)短信、瀏覽購物車、購買等行為,又如用戶在金融機構(gòu)進行匯款、取款等行為,可以用于指示用戶針對終端設(shè)備中的待評估信息進行的操作行為。
本發(fā)明實施例中,待評估信息可以是終端設(shè)備中的信息,如接收的短信、來電、瀏覽器中的網(wǎng)頁或顯示界面的廣告彈窗等信息。第一用戶可以是當前使用終端設(shè)備的用戶。
在實際應(yīng)用中,數(shù)據(jù)處理設(shè)備實時獲取第一用戶針對終端設(shè)備中的待評估信息進行操作的用戶行為信息,并將這些用戶行為信息存儲于數(shù)據(jù)處理設(shè)備中的用戶信息數(shù)據(jù)庫。后續(xù)數(shù)據(jù)處理設(shè)備可以利用相關(guān)算法對存儲于用戶信息數(shù)據(jù)庫中的數(shù)據(jù)進行相應(yīng)的處理。相應(yīng)的,數(shù)據(jù)處理設(shè)備中還可以有詐騙信息數(shù)據(jù)庫,可以用于存儲與詐騙事件相關(guān)的所有詐騙信息。即本發(fā)明實施例中,與用戶相關(guān)的信息均存儲于用戶信息數(shù)據(jù)庫中,與詐騙事件相關(guān)的信息均存儲于詐騙信息數(shù)據(jù)庫中,提高了后續(xù)數(shù)據(jù)處理設(shè)備在進行數(shù)據(jù)處理的過程中調(diào)用數(shù)據(jù)的便捷性。
舉例來說,假設(shè)用戶a的手機收到了一條短信,短信內(nèi)容為:“尊敬的用戶a您好,恭喜您申購的xx公司的新股中簽,共計500股,現(xiàn)已對您的賬戶資金進行凍結(jié),詳情請咨詢134****1142”。在此場景中,待評估信息可以是為用戶a收到的這條短信及短信內(nèi)容,而用戶行為信息可以指示用戶a對這條短信的內(nèi)容的相關(guān)操作行為,如用戶刪除短信、打開讀取短信、對短信中的號碼134****1142進行撥號等操作行為。
s200中,至少一個評估指標可以是數(shù)據(jù)處理設(shè)備經(jīng)過對歷史詐騙事件及與歷史詐騙事件相關(guān)的用戶的信息進行分析后得到的、可以表征用戶對歷史詐騙事件的敏感度的指標,如與用戶相關(guān)且可以體現(xiàn)出用戶的特征,如性格、愛好等的電信詐騙易感參數(shù),與詐騙事件相關(guān)的電信詐騙特征向量等。數(shù)據(jù)處理設(shè)備可以根據(jù)至少一個評估指標對用戶行為信息進行分析處理,以得到評估概率。
在實際應(yīng)用中,數(shù)據(jù)處理設(shè)備可以僅根據(jù)一個評估指標對用戶行為信息進行分析處理,得到一個評估概率,如數(shù)據(jù)處理設(shè)備可以根據(jù)與用戶相關(guān)的電信詐騙易感參數(shù),利用推薦算法,如商品推薦算法、關(guān)聯(lián)規(guī)則算法等,對用戶行為信息進行分析處理,可以得到第一用戶發(fā)生某種詐騙行為的傾向度,該傾向度可以是一個概率值,即評估概率。
或者,數(shù)據(jù)處理設(shè)備也可以根據(jù)與詐騙事件相關(guān)的電信詐騙特征向量,利用分類算法,如貝葉斯分類算法等,對用戶行為信息進行分析計算,得到第一用戶的當前用戶行為與已有的電信詐騙行為之間的匹配度,該匹配度的值也可以為本發(fā)明實施例中的評估概率。
或者,為使得評估概率更加的精確,數(shù)據(jù)處理設(shè)備還可以根據(jù)兩個或者兩個以上的評估指標對用戶行為信息進行分析處理,得到一個評估概率,如同時根據(jù)電信詐騙易感參數(shù)和電信詐騙特征向量對用戶行為信息進行分析計算,得到一個評估概率。具體使用幾種評估指標對用戶行為信息進行分析,可以根據(jù)實際應(yīng)用來確定,本發(fā)明實施例不作限制。
其中,評估概率可以表征用戶行為信息所指示的操作與歷史詐騙事件相關(guān)的歷史操作之間的相似度,如歷史詐騙事件為釣魚網(wǎng)站詐騙,其相關(guān)的歷史操作步驟可以包括點開網(wǎng)絡(luò)鏈接、登錄用戶賬號、瀏覽商品、點開廣告彈窗等,其中“廣告彈窗”即為釣魚網(wǎng)站的病毒源,因此,評估概率所表征的相似度可以為第一用戶當前的操作步驟與歷史操作步驟之間的相似度,如第一用戶依次按照上述步驟進行操作,顯然評估概率所表征的相似度會很高。
可選的,至少一個評估指標的確定可以包括以下步驟:
首先,數(shù)據(jù)處理設(shè)備可以確定其詐騙信息數(shù)據(jù)庫中的多個歷史詐騙事件,其中,歷史詐騙事件可以是已經(jīng)發(fā)生的電信詐騙活動,可以包括詐騙信息,該詐騙信息可以指示與詐騙信息相應(yīng)的歷史詐騙事件的詐騙行為,并且歷史詐騙事件還可以涉及針對該歷史詐騙事件進行過操作的用戶及與這些用戶相關(guān)的用戶信息。
在實際應(yīng)用中,數(shù)據(jù)處理設(shè)備可以通過網(wǎng)絡(luò)實時收集歷史詐騙事件和用戶信息,或者終端設(shè)備可以向數(shù)據(jù)處理設(shè)備上傳歷史詐騙事件和用戶信息。后續(xù),數(shù)據(jù)處理設(shè)備可以根據(jù)歷史詐騙事件分析出每個詐騙事件的相關(guān)特征,如主要詐騙領(lǐng)域、針對的主要人群等特征;數(shù)據(jù)處理設(shè)備還可以根據(jù)用戶信息分析出每個用戶的基本特征,如可以根據(jù)用戶信息指示的用戶受教育的程度,分析用戶傾向于哪些領(lǐng)域的詐騙事件等。
在具體的實施過程中,用戶信息可以包括用戶基本信息、用戶實時行為信息及用戶個性標簽信息等。用戶基本信息可以為用戶個人信息,如用戶身高、體重、興趣愛好、職業(yè)、教育程度等信息;用戶實時行為信息可以包括用戶針對終端設(shè)備中的信息進行操作的操作行為信息,如用戶撥號、收發(fā)短信、瀏覽購物車、購買等行為;用戶個性標簽信息可以是用戶自定義的信息,如用戶在社交賬號上的個性簽名等,其中,用戶個性標簽信息可以表征用戶的主觀認識,可以體現(xiàn)出用戶的人物性格等信息。
然后,數(shù)據(jù)處理設(shè)備可以獲取多個歷史詐騙事件中每個歷史詐騙事件相關(guān)的詐騙信息和用戶信息,詐騙信息指示了相應(yīng)歷史詐騙事件的詐騙行為。例如,詐騙信息可以是用戶收到的包括電話號碼或者網(wǎng)絡(luò)鏈接的短信,其中,短信中的電話號碼為詐騙號碼,網(wǎng)絡(luò)鏈接為帶有木馬病毒的網(wǎng)址鏈接,這時,用戶撥打短信中的電話號碼的撥號行為可以為詐騙信息所指示的詐騙行為,或者用戶點擊短信中的網(wǎng)址鏈接的點擊行為可以為詐騙信息所指示的詐騙行為。
其次,數(shù)據(jù)處理設(shè)備可以對詐騙信息和用戶信息進行處理,確定用于指示多個歷史詐騙事件中每個歷史詐騙事件的事件特征的第一評估指標,及用于指示多個用戶中每個用戶受到詐騙的難易程度的第二評估指標。本發(fā)明實施例中,主要以第一評估指標可以為電信詐騙特征向量,而第二評估指標可以為電信詐騙易感參數(shù)為例。
在實際應(yīng)用中,確定評估指標包括但不僅限于以下兩種方式:
方式一、數(shù)據(jù)處理設(shè)備利用類似于用戶畫像算法的行為畫像算法對詐騙信息進行分析處理,確定用于指示多個歷史詐騙事件中每個歷史詐騙事件的事件特征的第一評估指標,其中,事件特征中包括了詐騙事件的行為特征。
比如,詐騙事件為短信詐騙,則詐騙事件的行為特征可以為用戶對手機收到的詐騙短信中的號碼進行的撥號操作;或者,若詐騙事件為點對點(peer-to-peer,p2p)網(wǎng)絡(luò)借貸金融詐騙事件,則詐騙事件的行為特征可以為用戶在p2p網(wǎng)絡(luò)借貸平臺上對未經(jīng)過平臺驗證的銀行賬號進行匯款的操作等。
為更直觀的表示第一評估指標的確定過程,下面以第一評估指標可以是電信詐騙特征向量為例,引入獲得電信詐騙特征向量的公式(1),需要說明的是,該公式只是適應(yīng)性的,即公式(1)只是給出了電信詐騙特征向量、詐騙信息及事件特征之間的函數(shù)關(guān)系。
z電信詐騙特征向量=f行為畫像算法(y詐騙信息,y事件特征)公式(1)
在實際應(yīng)用中,由于行為畫像算法有多種分類,使用不同的畫像算法對詐騙信息進行分析處理,可以得到不同的結(jié)果。比如,一方面,有些行為畫像算法,如關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法、協(xié)同過濾算法等,對詐騙信息進行分析計算后,得到的電信詐騙特征向量可以為一維,即計算得到的可以是一個確切的值,這時,該值可以表示詐騙信息所相應(yīng)的歷史詐騙事件騙到用戶的難度,如從1到100,難度逐級遞增,若上述計算出的值為40,則表示相應(yīng)的歷史詐騙事件騙到用戶的難度為40,即用戶容易受到該歷史詐騙事件的詐騙。
另一方面,有些行為畫像算法,如分類與回歸樹(classificationandregressiontrees,cart)等決策樹算法,對詐騙信息進行分析計算后,得到的電信詐騙特征向量可以為多維,即計算后得到的為一個向量,這時,該電信詐騙特征向量可以表示相應(yīng)的歷史詐騙事件在哪些步驟或者操作上容易騙到用戶。
方式二、數(shù)據(jù)處理設(shè)備可以利用用戶畫像算法對用戶信息進行分析處理,可以確定用于指示多個用戶中每個用戶受到詐騙的難易程度的第二評估指標。
同樣的,為更直觀的表示第二評估指標的確定過程,下面以第二評估指標可以是電信詐騙易感參數(shù)為例,引入獲得電信詐騙易感參數(shù)的公式(2),需要說明的是,該公式只是適應(yīng)性的,即公式(1)只是給出了電信詐騙易感參數(shù)、用戶基本信息、用戶行為信息及用戶個性標簽信息之間的函數(shù)關(guān)系。
z電信詐騙易感參數(shù)=f用戶畫像算法(x基本信息,x行為信息,x個性標簽)公式(2)
公式(2)中,x基本信息表示用戶基本信息,x行為信息表示用戶行為信息,x個性標簽表示用戶個性標簽信息,其中,上述三類信息可以根據(jù)實際情況進行選擇使用,如若數(shù)據(jù)處理設(shè)備并未采集到用戶個性標簽信息,則數(shù)據(jù)處理設(shè)備可以根據(jù)用戶基本信息和用戶行為信息,利用用戶畫像算法計算得到用戶的電信詐騙易感參數(shù)。
在實際應(yīng)用中,用戶畫像算法有很多種,有的畫像算法,如關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法等,可以求出確切的值,則該確切的值就是電信詐騙易感參數(shù)值,可以表征用戶受到詐騙的難易程度。比如,難度1-100,逐級遞增,即1難度最低,100難度最高,若數(shù)據(jù)處理設(shè)備利用用戶畫像算法對用戶信息進行處理后,得到一個確切值為60,則可以說明該用戶受到詐騙的難度較高,即該用戶不容易受到詐騙。
而有的畫像算法,如分類與回歸樹(classificationandregressiontrees,cart)等決策樹算法,對用戶信息進行分析計算后,得出的電信詐騙易感參數(shù)可以為多維,即計算以后得到的是關(guān)于用戶的特征向量,即可以表征用戶在哪些方面或者領(lǐng)域容易受到詐騙。
可選的,根據(jù)至少一個評估指標對用戶行為信息進行處理,獲得評估概率不僅限于以下兩種情況:
情況一、根據(jù)第一評估指標及用戶行為信息,確定用于表征第一用戶的用戶行為信息對應(yīng)的用戶操作與詐騙信息所指示的詐騙行為之間的相似度的第一參考值。
在實際應(yīng)用中,假設(shè)第一評估指標為電信詐騙特征向量,則數(shù)據(jù)處理設(shè)備可以根據(jù)該電信詐騙特征向量對用戶行為信息進行評估,如數(shù)據(jù)處理設(shè)備可以利用分類算法,如貝葉斯分類算法等,計算當前用戶行為信息對應(yīng)的用戶操作與詐騙信息所指示的詐騙行為之間的相似度,而計算出來的相似度的值即為第一參考值,其范圍可以為[0,1]。由于分類算法種類繁多,具體選用哪種分類算法進行計算可以根據(jù)實際應(yīng)用進行選擇,本發(fā)明實施例中不作限制,并且上述分類算法的計算過程與現(xiàn)有技術(shù)中的分類算法的計算過程一致,本發(fā)明實施例不作贅述。然后,數(shù)據(jù)處理設(shè)備可以根據(jù)計算出的第一參考值,獲取評估概率。
情況二、根據(jù)第二評估指標及用戶行為信息,確定用于表征第一用戶的當前操作相對于第一用戶針對歷史詐騙事件的歷史操作的傾向度的第二參考值。
在具體的實施過程中,假設(shè)第二評估指標為與用戶相關(guān)的電信詐騙易感參數(shù),則數(shù)據(jù)處理設(shè)備可以根據(jù)電信詐騙易感參數(shù)對用戶行為信息進行評估,如數(shù)據(jù)處理設(shè)備可以利用推薦算法,如商品推薦算法等,計算第一用戶的當前操作相對于第一用戶針對歷史詐騙事件的歷史操作的傾向度,即計算第一用戶發(fā)生某種詐騙行為的傾向度,而計算出的傾向度的值即為第二參考值,其范圍也可以為[0,1]??梢愿鶕?jù)實際情況選擇恰當?shù)乃惴ㄓ嬎阌脩舢斍鞍l(fā)生某種詐騙行為的傾向度,具體采用何種推薦算法進行計算,本發(fā)明實施例不作任何限制,同樣地,上述推薦算法的計算過程與現(xiàn)有技術(shù)中推薦算法的計算過程一致,本發(fā)明實施例不作贅述。然后,數(shù)據(jù)處理設(shè)備可以根據(jù)第二參考值,獲得一評估概率。
在實際應(yīng)用中,數(shù)據(jù)處理設(shè)備可以通過上述兩種情況中的一種評估方式或者同時使用上述兩種評估方式對用戶行為信息進行評估,以獲得評估概率。
可選的,基于第一參考值和/或第二參考值,獲得一評估概率,可以包括:設(shè)置至少一個權(quán)重,該至少一個權(quán)重包括與第一參考值對應(yīng)的第一權(quán)重,和/或,與第二參考值對應(yīng)的第二權(quán)重;其中,第一權(quán)重用于表征在判定第一用戶是否受到詐騙的過程中第一參考值占的比重,第二權(quán)重用于表征在判定第一用戶是否受到詐騙的過程中第二參考值占的比重;基于第一參考值、第二參考值及至少一個權(quán)重,確定評估概率。
為更加直觀的介紹評估概率的獲取過程,下面引入評估概率函數(shù)關(guān)系的公式(3),公式(3)只是適應(yīng)性的,即公式(3)只是給出了下述相關(guān)變量之間的函數(shù)關(guān)系,并不是用于對評估概率的計算進行限制。
p評估=a權(quán)重*f分類算法(z電信詐騙特征向量,y用戶行為信息)+(1-a權(quán)重)*f推薦算法(z電信詐騙易感參數(shù),y用戶行為信息)公式(3)
公式(3)中,a權(quán)重在本發(fā)明實施例中可以稱為第一權(quán)重,其值域為[0,1],相應(yīng)的,(1-a權(quán)重)可以為第二權(quán)重;或者,a權(quán)重在本發(fā)明實施例中也可以為第二權(quán)重,則相應(yīng)地,(1-a權(quán)重)可以為第一權(quán)重,本發(fā)明實施例中,第一權(quán)重與第二權(quán)重之和可以為1。
需要說明的是,在實際應(yīng)用中,若數(shù)據(jù)處理設(shè)備使用三個或者三個以上的評估指標對用戶行為信息進行評估,即也可相應(yīng)設(shè)置三個或者三個以上的權(quán)重,無論是何種情況,數(shù)據(jù)處理設(shè)備或者用戶設(shè)置的權(quán)重之和均為1;z電信詐騙特征向量即可以對應(yīng)于上述的第一評估指標,z電信詐騙易感參數(shù)可以對應(yīng)于第二評估指標;f分類算法為分類算法,f推薦算法為推薦算法,該兩個算法在上文中已作介紹,在此不再贅述;y用戶行為信息可以表示為用戶的實時行為操作等信息;p評估可以表示評估概率。
由公式(3)可知,在實際應(yīng)用中,權(quán)重的設(shè)定方式可以為:數(shù)據(jù)處理設(shè)備可以根據(jù)用戶信息數(shù)據(jù)庫的信息量和詐騙信息數(shù)據(jù)庫信息量自動設(shè)置至少一個權(quán)重。
比如,在數(shù)據(jù)庫存儲范圍相當?shù)那闆r下,數(shù)據(jù)處理設(shè)備檢測到用戶信息數(shù)據(jù)庫的信息量為60%,而詐騙信息數(shù)據(jù)庫的信息量為20%,即用戶信息數(shù)據(jù)庫的數(shù)據(jù)比詐騙信息數(shù)據(jù)庫的數(shù)據(jù)更為豐富,這時,數(shù)據(jù)處理設(shè)備可以首先選擇設(shè)置第二權(quán)重,將側(cè)重點放在判定第一用戶的當前操作相對于第一用戶針對歷史詐騙事件的歷史操作的傾向度上,增加第二參考值在判定第一用戶是否受到詐騙的過程中的比重?;蛘撸魯?shù)據(jù)處理設(shè)備檢測到用戶信息數(shù)據(jù)庫的信息量為10%,而詐騙信息數(shù)據(jù)庫的信息量70%,即詐騙信息數(shù)據(jù)庫的數(shù)據(jù)比用戶信息數(shù)據(jù)庫的數(shù)據(jù)更為豐富,這時,數(shù)據(jù)處理設(shè)備可以首先設(shè)置第一權(quán)重,即數(shù)據(jù)處理設(shè)備可以將側(cè)重點放在第一用戶的用戶行為信息對應(yīng)的用戶操作與詐騙信息所指示的詐騙行為之間的相似度上,增加第一參考值在判定第一用戶是否受到詐騙的過程中的比重。
下面介紹a權(quán)重設(shè)置在其范圍的兩個端點處,即a權(quán)重為0或者a權(quán)重為1的兩種情況。
比如,設(shè)置a權(quán)重為0時,則由公式(3)可得到:
p評估=f推薦算法(z電信詐騙易感參數(shù),y用戶行為信息)公式(4)
即公式(4)中,數(shù)據(jù)處理設(shè)備利用推薦算法計算得到的第一用戶的當前操作相對于第一用戶針對歷史詐騙事件的歷史操作的傾向度即為評估概率。
或者,設(shè)置a權(quán)重為1,則由公式(3)可得到:
p評估=f分類算法(z電信詐騙特征向量,y用戶行為信息)公式(5)
即公式(5)中,數(shù)據(jù)處理設(shè)備利用分類算法計算得到的第一用戶行為信息對應(yīng)的用戶操作與詐騙信息所指示的詐騙行為之間的相似度即為評估概率值。
當然,在實際應(yīng)用中,為使得評估概率的值更為準確,a權(quán)重也可以設(shè)定為其范圍內(nèi)的值,如0.6,這時可以利用公式(3)獲得評估概率的值。
s300中,預(yù)設(shè)概率可以根據(jù)實際情況進行設(shè)定,比如若相關(guān)部門當前對電信詐騙打擊力度加大時,可以把預(yù)設(shè)概率設(shè)得低一點,如50%等,使得更多詐騙事件或者類似的詐騙事件落入相關(guān)部門處理的范圍;若當前詐騙事件過多,且用戶對詐騙事件的認知已經(jīng)達到了一定的程度時,這一點可以通過上述的電信詐騙易感參數(shù)進行判定,這時,可以將預(yù)設(shè)概率設(shè)高,如80%等。當確定出的評估概率大于預(yù)設(shè)概率,則可以確定第一用戶針對終端設(shè)備中進行操作的待評估信息為電信詐騙信息。
可選的,在若評估概率大于預(yù)設(shè)概率,確定待評估信息為電信詐騙信息之后,數(shù)據(jù)處理設(shè)備還可以根據(jù)電信詐騙信息,確定與用戶行為信息相關(guān)的提示信息,該提示信息用于提示用戶對電信詐騙信息進行處理;通過數(shù)據(jù)處理設(shè)備或者與數(shù)據(jù)處理設(shè)備相連的第三方輔助設(shè)備輸出提示信息。
其中,第三方輔助設(shè)備可以為終端設(shè)備,如電腦、手機等。提示信息中可以包括上述計算出的評估概率的值,以提醒用戶其當前的操作受到詐騙的可能性,及時提醒用戶對當前操作采取措施。
比如,若預(yù)設(shè)概率為80%,評估概率為90%,顯然評估概率大于預(yù)設(shè)概率,這時,數(shù)據(jù)處理設(shè)備可以根據(jù)用戶信息、電信詐騙信息等信息,自動生成與第一用戶相關(guān)的提示信息,該提示信息中可以包括評估概率為90%的相關(guān)信息,然后將該提示信息發(fā)送給用戶終端,或者,發(fā)送給與當前用戶終端相連或者綁定的另一用戶終端,如老人的當前操作受到詐騙的可能性已經(jīng)超過了預(yù)設(shè)概率值,則數(shù)據(jù)處理設(shè)備可以將提示信息發(fā)送給與老人的手機綁定的老人的子女的手機上,有助于提高數(shù)據(jù)處理設(shè)備對電信詐騙信息的識別率,以便對電信詐騙信息進行及時攔截。
如圖2所示,基于同一發(fā)明構(gòu)思,本發(fā)明實施例還提供一種數(shù)據(jù)處理設(shè)備,該數(shù)據(jù)處理設(shè)備可以包括第一獲取模塊10、第一處理模塊20及第一確定模塊30。
其中,第一獲取模塊10,用于獲取來自與所述數(shù)據(jù)處理設(shè)備連接的終端設(shè)備的用戶行為信息,所述用戶行為信息用于指示第一用戶針對所述終端設(shè)備中的待評估信息進行的操作行為。
第一處理模塊20,用于基于至少一個評估指標對所述用戶行為信息進行處理,獲得評估概率;其中,所述至少一個評估指標為基于歷史詐騙事件確定的、用于表征所述第一用戶對所述歷史詐騙事件的敏感度,所述評估概率用于表征所述用戶行為信息所指示的操作與所述歷史詐騙事件相關(guān)的歷史操作的匹配度。
第一確定模塊30,用于若所述評估概率大于預(yù)設(shè)概率,確定所述待評估信息為電信詐騙信息。
在實際應(yīng)用中,數(shù)據(jù)處理設(shè)備可以是具有數(shù)據(jù)采集功能,并可以利用數(shù)據(jù)挖掘等技術(shù)對采集的數(shù)據(jù)進行大數(shù)據(jù)處理的設(shè)備,如遠端數(shù)據(jù)采集器、無線數(shù)據(jù)采集器、網(wǎng)頁數(shù)據(jù)采集器等,數(shù)據(jù)處理設(shè)備具體為哪種設(shè)備可以與實際中的應(yīng)用相關(guān),本發(fā)明實施例對此不作具體限制。
可選的,所述數(shù)據(jù)處理設(shè)備還包括:第二確定模塊,用于確定多個歷史詐騙事件;第二獲取模塊,用于獲取所述多個歷史詐騙事件中每個歷史詐騙事件相關(guān)的詐騙信息和用戶信息,所述詐騙信息指示了相應(yīng)歷史詐騙事件的詐騙行為;第二處理模塊,用于對所述詐騙信息和所述用戶信息進行處理,確定用于指示所述多個歷史詐騙事件中每個歷史詐騙事件的事件特征的第一評估指標,及用于指示所述多個用戶中每個用戶受到詐騙的難易程度的第二評估指標。
可選的,所述第一處理模塊20用于:基于所述第一評估指標及所述用戶行為信息,確定用于表征所述第一用戶的用戶行為信息對應(yīng)的用戶操作與所述詐騙信息指示的詐騙行為之間的相似度的第一參考值,及,基于所述第二評估指標及所述用戶行為信息,確定用于表征所述第一用戶的當前操作相對于所述第一用戶針對所述歷史詐騙事件的歷史操作的傾向度的第二參考值;基于所述第一參考值和/或所述第二參考值,獲得評估概率。
可選的,所述第一處理模塊20用于:設(shè)置至少一個權(quán)重,所述至少一個權(quán)重包括與所述第一參考值對應(yīng)的第一權(quán)重,和/或與所述第二參考值對應(yīng)的第二權(quán)重;基于所述第一參考值、所述第二參考值及所述至少一個權(quán)重,確定所述評估概率。
可選的,所述數(shù)據(jù)處理設(shè)備還包括:第三確定模塊,用于在若所述評估概率大于預(yù)設(shè)概率,確定所述待評估信息為電信詐騙信息之后,基于所述電信詐騙信息,確定與所述用戶行為信息相關(guān)的提示信息,所述提示信息用于提示用戶對所述電信詐騙信息進行處理;輸出模塊,用于通過所述數(shù)據(jù)處理設(shè)備或者與所述數(shù)據(jù)處理設(shè)備相連的第三方輔助設(shè)備輸出所述提示信息。
以上所述,以上的所有實施例僅用以對本發(fā)明的技術(shù)方案進行的詳細的介紹,且以上實施例的說明僅僅只是用于幫助理解本發(fā)明的方法及其核心思想,不應(yīng)該理解為對本發(fā)明的限定。本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可以輕易的想到的變化或者替換,都應(yīng)該涵蓋在本發(fā)明的保護范圍之內(nèi)。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種修改和變形而不脫離本實用新型的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同的技術(shù)范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。