一種網(wǎng)頁(yè)地址校正方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及互聯(lián)網(wǎng)信息技術(shù)領(lǐng)域,尤其涉及一種網(wǎng)頁(yè)地址校正方法及系統(tǒng)。所述網(wǎng)頁(yè)地址校正方法包括:步驟100:接收電子郵件,并獲取郵件文本字符流;步驟101:判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,如果郵件文本字符流的網(wǎng)絡(luò)鏈接地址是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,執(zhí)行步驟102;步驟102:識(shí)別錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,并對(duì)該錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置進(jìn)行校正,生成正確的網(wǎng)絡(luò)鏈接地址。本發(fā)明在接收到電子郵件后,檢測(cè)電子郵件中存在的網(wǎng)絡(luò)鏈接地址是否有效,如果網(wǎng)絡(luò)鏈接地址錯(cuò)誤,則根據(jù)WEB地址協(xié)議標(biāo)準(zhǔn)找出錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,并對(duì)出錯(cuò)位置進(jìn)行校正。本發(fā)明操作簡(jiǎn)單,無(wú)需用戶手動(dòng)操作,有利于提升用戶的使用體驗(yàn)。
【專利說(shuō)明】
-種網(wǎng)頁(yè)地址校正方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及互聯(lián)網(wǎng)信息技術(shù)領(lǐng)域,尤其設(shè)及一種網(wǎng)頁(yè)地址校正方法及系統(tǒng)。
【背景技術(shù)】
[0002] 用戶在發(fā)送電子郵件時(shí),可在郵件文本中插入網(wǎng)絡(luò)鏈接地址,郵件接收用戶接收 到郵件后,通過(guò)點(diǎn)擊郵件文本中的網(wǎng)絡(luò)鏈接地址,即可打開該網(wǎng)絡(luò)鏈接地址并獲取網(wǎng)絡(luò)信 息。
[0003] 現(xiàn)有技術(shù)中,用戶經(jīng)常會(huì)遇到郵件文本中的網(wǎng)絡(luò)鏈接地址由于錯(cuò)誤而無(wú)法正常打 開的情況,而電子郵件并不能自動(dòng)判斷郵件文本中的網(wǎng)絡(luò)鏈接地址是否錯(cuò)誤。如果需要判 斷該網(wǎng)絡(luò)鏈接地址是否為錯(cuò)誤地址,用戶需要將該網(wǎng)絡(luò)鏈接地址手動(dòng)拷貝到瀏覽器,如果 瀏覽器也無(wú)法正常打開,則說(shuō)明該網(wǎng)絡(luò)鏈接地址是錯(cuò)誤的,操作比較繁瑣;且檢測(cè)出錯(cuò)誤網(wǎng) 絡(luò)鏈接地址后,無(wú)法對(duì)該錯(cuò)誤網(wǎng)絡(luò)鏈接地址進(jìn)行校正,導(dǎo)致用戶無(wú)法正常獲取對(duì)應(yīng)的網(wǎng)絡(luò) 信息,影響用戶的使用體驗(yàn)。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明提供了一種網(wǎng)頁(yè)地址校正方法及系統(tǒng),旨在解決現(xiàn)有的電子郵件無(wú)法自動(dòng) 判斷郵件文本中的網(wǎng)絡(luò)鏈接地址是否錯(cuò)誤,且無(wú)法對(duì)錯(cuò)誤網(wǎng)絡(luò)鏈接地址進(jìn)行校正的技術(shù)問(wèn) 題。
[0005] 為了解決W上提出的問(wèn)題,本發(fā)明采用的技術(shù)方案為:一種網(wǎng)頁(yè)地址校正方法,包 括W下步驟:
[0006] 步驟100:接收電子郵件,并獲取郵件文本字符流;
[0007] 步驟101:判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,如果 郵件文本字符流的網(wǎng)絡(luò)鏈接地址是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,執(zhí)行步驟102
[000引步驟102:識(shí)別錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,并對(duì)該錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位 置進(jìn)行校正,生成正確的網(wǎng)絡(luò)鏈接地址。
[0009] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:所述步驟100還包括:將獲取的郵件文本字 符流保存在本地文本字符串中,并顯示郵件文本字符流。
[0010] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:所述步驟101還包括:判斷郵件文本字符流 中是否存在網(wǎng)絡(luò)鏈接地址,如果郵件文本字符流中不存在網(wǎng)絡(luò)鏈接地址,略過(guò)該郵件文本 字符流不做校正處理;如果郵件文本字符流中存在網(wǎng)絡(luò)鏈接地址,則判斷郵件文本字符流 中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址。
[0011] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:所述判斷郵件文本字符流中是否存在網(wǎng)絡(luò) 鏈接地址的判斷方式為:在郵件文本中有指定鏈接地址的錯(cuò)點(diǎn),通過(guò)解析鏈接地址的錯(cuò)點(diǎn) 判斷郵件文本字符流中是否存在網(wǎng)絡(luò)鏈接地址。
[0012] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:所述判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地 址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址的判斷方式為:建立正則表達(dá)式字符串,通過(guò)正則表達(dá)式字符 串過(guò)濾郵件文本,對(duì)網(wǎng)絡(luò)鏈接地址進(jìn)行匹配,從而確定該網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈 接地址。
[0013] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:在所述步驟102中,所述生成正確的網(wǎng)絡(luò)鏈 接地址具體包括:根據(jù)WEB地址協(xié)議標(biāo)準(zhǔn)從郵件文本字符流中對(duì)正確的網(wǎng)絡(luò)鏈接地址進(jìn)行 識(shí)別,找出錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,在本地文本字符串中獲取正確字符,將獲取的正 確字符與錯(cuò)誤網(wǎng)絡(luò)鏈接地址中出錯(cuò)位置的字符進(jìn)行替換,生成正確的網(wǎng)絡(luò)鏈接地址;并刪 除郵件文本字符流中錯(cuò)誤的網(wǎng)絡(luò)鏈接地址,將正確的網(wǎng)絡(luò)鏈接地址保存在郵件文本字符流 中。
[0014] 本發(fā)明實(shí)施例采取的另一技術(shù)方案為:一種網(wǎng)頁(yè)地址校正系統(tǒng),包括郵件接收模 塊、地址判斷模塊和地址校正模塊,所述郵件接收模塊用于接收電子郵件,并獲取郵件文本 字符流;所述地址判斷模塊用于判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈 接地址,如果郵件文本字符流的網(wǎng)絡(luò)鏈接地址是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,通過(guò)地址校正模塊對(duì) 錯(cuò)誤網(wǎng)絡(luò)鏈接地址進(jìn)行校正;所述地址校正模塊用于識(shí)別錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置, 并對(duì)該錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置進(jìn)行校正,生成正確的網(wǎng)絡(luò)鏈接地址。
[0015] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:還包括存儲(chǔ)模塊和顯示模塊,所述存儲(chǔ)模 塊用于將獲取的郵件文本字符流保存在本地文本字符串中;所述顯示模塊用于顯示郵件文 本字符流。
[0016] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:還包括第一判斷模塊,第一判斷模塊用于 判斷郵件文本字符流中是否存在網(wǎng)絡(luò)鏈接地址,如果郵件文本字符流中不存在網(wǎng)絡(luò)鏈接地 址,略過(guò)該郵件文本字符流不做校正處理;如果郵件文本字符流中存在網(wǎng)絡(luò)鏈接地址,通過(guò) 地址判斷模塊判斷網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址。
[0017] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:所述地址校正模塊生成正確的網(wǎng)絡(luò)鏈接地 址具體包括:根據(jù)肥B地址協(xié)議標(biāo)準(zhǔn)從郵件文本字符流中對(duì)正確的網(wǎng)絡(luò)鏈接地址進(jìn)行識(shí)別, 找出錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,在本地文本字符串中獲取正確字符,將獲取的正確字 符與錯(cuò)誤網(wǎng)絡(luò)鏈接地址中出錯(cuò)位置的字符進(jìn)行替換,生成正確的網(wǎng)絡(luò)鏈接地址;并刪除郵 件文本字符流中錯(cuò)誤的網(wǎng)絡(luò)鏈接地址,將正確的網(wǎng)絡(luò)鏈接地址保存在郵件文本字符流中。
[0018] 與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例的有益效果在于:本發(fā)明實(shí)施例的網(wǎng)頁(yè)地址校正 方法及系統(tǒng)在接收到電子郵件后,通過(guò)郵件文本字符流判斷該電子郵件中是否存在網(wǎng)絡(luò)鏈 接地址,如果存在網(wǎng)絡(luò)鏈接地址,則進(jìn)一步檢測(cè)存在的網(wǎng)絡(luò)鏈接地址是否有效,如果網(wǎng)絡(luò)鏈 接地址錯(cuò)誤,則根據(jù)W邸地址協(xié)議標(biāo)準(zhǔn)找出錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,并在本地文本字 符串中獲取正確字符,將獲取的正確字符與錯(cuò)誤網(wǎng)絡(luò)鏈接地址中出錯(cuò)位置的字符進(jìn)行替 換,從而生成正確的網(wǎng)絡(luò)鏈接地址。本發(fā)明操作簡(jiǎn)單,無(wú)需用戶手動(dòng)操作,有利于提升用戶 的使用體驗(yàn)。
【附圖說(shuō)明】
[0019] 圖1為本發(fā)明第一實(shí)施例的網(wǎng)頁(yè)地址校正方法的流程圖;
[0020] 圖2為本發(fā)明第二實(shí)施例的網(wǎng)頁(yè)地址校正方法的流程圖;
[0021] 圖3為本發(fā)明第一實(shí)施例的網(wǎng)頁(yè)地址校正系統(tǒng)的結(jié)構(gòu)示意圖;
[0022] 圖4為本發(fā)明第二實(shí)施例的網(wǎng)頁(yè)地址校正系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0023] 為了便于理解本發(fā)明,下面將參照相關(guān)附圖對(duì)本發(fā)明進(jìn)行更全面的描述。附圖中 給出了本發(fā)明的較佳實(shí)施例。但是,本發(fā)明可W W許多不同的形式來(lái)實(shí)現(xiàn),并不限于本文所 描述的實(shí)施例。相反地,提供運(yùn)些實(shí)施例的目的是使對(duì)本發(fā)明的公開內(nèi)容的理解更加透徹 全面。
[0024] 除非另有定義,本文所使用的所有的技術(shù)和科學(xué)術(shù)語(yǔ)與屬于本發(fā)明的技術(shù)領(lǐng)域的 技術(shù)人員通常理解的含義相同。本文中在本發(fā)明的說(shuō)明書中所使用的術(shù)語(yǔ)只是為了描述具 體的實(shí)施例的目的,不是旨在于限制本發(fā)明。
[0025] 請(qǐng)參閱圖1,是本發(fā)明第一實(shí)施例的網(wǎng)頁(yè)地址校正方法的流程圖。本發(fā)明第一實(shí)施 例的網(wǎng)頁(yè)地址校正方法包括W下步驟:
[0026] 步驟100:接收電子郵件,并獲取郵件文本字符流;
[0027] 步驟101:判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,如果 郵件文本字符流的網(wǎng)絡(luò)鏈接地址是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,執(zhí)行步驟102;
[0028] 步驟102:識(shí)別錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,并對(duì)該錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位 置進(jìn)行校正,生成正確的網(wǎng)絡(luò)鏈接地址。
[0029] 請(qǐng)參閱圖2,是本發(fā)明第二實(shí)施例的網(wǎng)頁(yè)地址校正方法的流程圖。本發(fā)明第二實(shí)施 例的網(wǎng)頁(yè)地址校正方法包括W下步驟:
[0030] 步驟200:接收電子郵件,并獲取郵件文本的字符流;
[0031] 在步驟200中,接收電子郵件的方式為通過(guò)服務(wù)器接收電子郵件,在本發(fā)明實(shí)施例 中,獲取的郵件文本格式為HTML文件(Hype巧ext Mark-up Language,是一種制作萬(wàn)維網(wǎng)頁(yè) 面的標(biāo)準(zhǔn)語(yǔ)言)格式,HTML文本是目前網(wǎng)絡(luò)上應(yīng)用最為廣泛的語(yǔ)言,也是構(gòu)成網(wǎng)頁(yè)文檔的主 要語(yǔ)言。HTML文本是由HTML命令組成的描述性文本,HTML命令可W說(shuō)明文字、圖形、動(dòng)畫、聲 音、表格、鏈接等。HTML文本的結(jié)構(gòu)包括頭部化ead)、主體(Body)兩大部分,其中頭部描述瀏 覽器所需的信息,而主體則包含所要說(shuō)明的具體內(nèi)容。在本發(fā)明其他實(shí)施例中,郵件文本格 式也可為其他格式,例如普通文本格式等。
[0032] 在步驟200中,獲取郵件文本的字符流的獲取方式為:通過(guò)Stream方式W字符流格 式從服務(wù)器中下載郵件文本,完成下載后,本地顯示的郵件文本是文件流數(shù)據(jù)。其中, Stream泛指流媒體技術(shù),流媒體技術(shù)是一種新的媒體傳送方式,是指采用流式傳輸?shù)姆绞?進(jìn)行網(wǎng)絡(luò)播放的媒體格式。
[0033] 步驟201:將獲取的郵件文本字符流保存在本地文本字符串中,并顯示郵件文本字 符流;
[0034] 步驟202:判斷郵件文本字符流中是否存在網(wǎng)絡(luò)鏈接地址,如果郵件文本字符流中 不存在網(wǎng)絡(luò)鏈接地址,執(zhí)行步驟203;如果郵件文本字符流中存在網(wǎng)絡(luò)鏈接地址,執(zhí)行步驟 204;
[0035] 在步驟202中,判斷郵件文本字符流中是否存在網(wǎng)絡(luò)鏈接地址的判斷方式為:在 HTML文本中有指定鏈接地址的錯(cuò)點(diǎn)"<a href/〉",通過(guò)解析鏈接地址的錯(cuò)點(diǎn)判斷郵件文本 字符流中是否存在網(wǎng)絡(luò)鏈接地址。
[0036] 步驟203:略過(guò)該郵件文本字符流不做校正處理;
[0037] 步驟204:判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,如果 郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是有效網(wǎng)絡(luò)鏈接地址,執(zhí)行步驟203;如果郵件文本字符 流中的網(wǎng)絡(luò)鏈接地址是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,執(zhí)行步驟205;
[0038] 在步驟204中,判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址 的判斷方式為:建立正則表達(dá)式字符串<曰.*化ref = \s*"( ['"]*)".*?〉( .*?)</曰〉,通過(guò)此 正則表達(dá)式字符串過(guò)濾HTML文本內(nèi)容,對(duì)網(wǎng)絡(luò)鏈接地址進(jìn)行匹配,從而確定該網(wǎng)絡(luò)鏈接地 址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址。其中,正則表達(dá)式(Regular Expression,在代碼中常簡(jiǎn)寫為 regex、regexp或RE),又稱正規(guī)表示法或常規(guī)表示法,計(jì)算機(jī)科學(xué)的一個(gè)概念。正則表達(dá)式 使用單個(gè)字符串來(lái)描述、匹配一系列符合某個(gè)句法規(guī)則的字符串。在很多文本編輯器里,正 則表達(dá)式通常被用來(lái)檢索、替換那些符合某個(gè)模式的文本。在本發(fā)明實(shí)施例中,建立正則表 達(dá)式字符串如下:
[00391
[0040] 步驟205:識(shí)別該網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,從本地文本字符串中獲取正確字符, 通過(guò)正確字符對(duì)該網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置進(jìn)行校正,生成正確的網(wǎng)絡(luò)鏈接地址;
[0041] 在步驟205中,正確網(wǎng)絡(luò)鏈接地址的生成方式包括:通常網(wǎng)絡(luò)鏈接地址錯(cuò)誤的原因 在于:由于編程或其他原因?qū)е戮W(wǎng)絡(luò)鏈接地址中的部分字符錯(cuò)誤,使得網(wǎng)絡(luò)鏈接地址無(wú)法 正常加載,本發(fā)明實(shí)施例根據(jù)W邸地址協(xié)議標(biāo)準(zhǔn)從郵件文本字符流中對(duì)正確的網(wǎng)絡(luò)鏈接地 址進(jìn)行識(shí)別,找出錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,并在本地文本字符串中獲取正確字符,將 獲取的正確字符與錯(cuò)誤網(wǎng)絡(luò)鏈接地址中出錯(cuò)位置的字符進(jìn)行替換,從而生成正確的網(wǎng)絡(luò)鏈 接地址。例如,錯(cuò)誤的網(wǎng)絡(luò)鏈接地址為:<a href=" sda"〉www. bai山1. com</a>,經(jīng)過(guò)系統(tǒng)識(shí) 別后,找出該網(wǎng)絡(luò)鏈接地址中的出錯(cuò)位置,并從文本字符串中獲取正確字符,通過(guò)正確字符 對(duì)網(wǎng)絡(luò)鏈接地址中的出錯(cuò)位置的自己進(jìn)行替換,替換后的網(wǎng)絡(luò)鏈接地址為:<a href = ht1:p: //www. baidu. com〉www. baidu. com</a>,用戶可通過(guò)替換后的網(wǎng)絡(luò)鏈接地址進(jìn)行正常 鏈接操作。
[0042] 步驟206:刪除郵件文本字符流中錯(cuò)誤的網(wǎng)絡(luò)鏈接地址,將正確的網(wǎng)絡(luò)鏈接地址保 存在郵件文本字符流中,并根據(jù)正確的網(wǎng)絡(luò)鏈接地址進(jìn)行鏈接操作;
[0043] 步驟207:判斷郵件文本字符流中是否存在兩個(gè)W上的網(wǎng)絡(luò)鏈接地址,如果存在兩 個(gè)W上的網(wǎng)絡(luò)鏈接地址,則重新執(zhí)行步驟204,直到遍歷完郵件文本字符流中的所有網(wǎng)絡(luò)鏈 接地址;如果不存在兩個(gè)W上的網(wǎng)絡(luò)鏈接地址,執(zhí)行步驟208;
[0044] 步驟208:結(jié)束本次校正操作。
[0045] 請(qǐng)參閱圖3,是本發(fā)明第一實(shí)施例的網(wǎng)頁(yè)地址校正系統(tǒng)的結(jié)構(gòu)示意圖。本發(fā)明第一 實(shí)施例的網(wǎng)頁(yè)地址校正系統(tǒng)包括郵件接收模塊、地址判斷模塊和地址校正模塊;
[0046] 郵件接收模塊用于接收電子郵件,并獲取郵件文本字符流;
[0047] 地址判斷模塊用于判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接 地址,如果郵件文本字符流的網(wǎng)絡(luò)鏈接地址是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,通過(guò)地址校正模塊對(duì)錯(cuò) 誤網(wǎng)絡(luò)鏈接地址進(jìn)行校正;
[0048] 地址校正模塊用于識(shí)別錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,并對(duì)該錯(cuò)誤網(wǎng)絡(luò)鏈接地址 的出錯(cuò)位置進(jìn)行校正,生成正確的網(wǎng)絡(luò)鏈接地址。
[0049] 請(qǐng)參閱圖4,是本發(fā)明第二實(shí)施例的網(wǎng)頁(yè)地址校正系統(tǒng)的結(jié)構(gòu)示意圖。本發(fā)明第二 實(shí)施例的網(wǎng)頁(yè)地址校正系統(tǒng)包括郵件接收模塊、存儲(chǔ)模塊、顯示模塊、第一判斷模塊、地址 判斷模塊、地址校正模塊和第二判斷模塊;
[0050] 郵件接收模塊用于接收電子郵件,并獲取郵件文本的字符流;其中,郵件接收模塊 接收電子郵件的方式為通過(guò)服務(wù)器接收電子郵件,在本發(fā)明實(shí)施例中,獲取的郵件文本格 式為HTML文本。郵件接收模塊獲取郵件文本的字符流的獲取方式為:通過(guò)Stream方式W字 符流格式從服務(wù)器中下載郵件文本,完成下載后,本地顯示的郵件文本是文件流數(shù)據(jù)。
[0051 ]存儲(chǔ)模塊用于將獲取的郵件文本字符流保存在本地文本字符串中;
[0052] 顯示模塊用于顯示郵件文本字符流;
[0053] 第一判斷模塊用于判斷郵件文本字符流中是否存在網(wǎng)絡(luò)鏈接地址,如果郵件文本 字符流中不存在網(wǎng)絡(luò)鏈接地址,略過(guò)該郵件文本字符流不做校正處理;如果郵件文本字符 流中存在網(wǎng)絡(luò)鏈接地址,通過(guò)地址判斷模塊判斷網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址; 其中,判斷郵件文本字符流中是否存在網(wǎng)絡(luò)鏈接地址的判斷方式為:在HTML文本中有指定 鏈接地址的錯(cuò)點(diǎn)"<a href/〉",通過(guò)解析鏈接地址的錯(cuò)點(diǎn)判斷郵件文本字符流中是否存在 網(wǎng)絡(luò)鏈接地址。
[0054] 地址判斷模塊用于判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接 地址,如果郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是有效網(wǎng)絡(luò)鏈接地址,略過(guò)該郵件文本字符 流不做校正處理;如果郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,通過(guò)地址 校正模塊對(duì)錯(cuò)誤網(wǎng)絡(luò)鏈接地址進(jìn)行校正;
[0055] 其中,判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址的判斷方 式為:建立正則表達(dá)式字符串<3.*化ref = \s*"(r"]*)".*?〉(.*?K/a〉,通過(guò)此正則表達(dá) 式字符串過(guò)濾HTML文本內(nèi)容,對(duì)網(wǎng)絡(luò)鏈接地址進(jìn)行匹配,從而確定該網(wǎng)絡(luò)鏈接地址是否是 錯(cuò)誤網(wǎng)絡(luò)鏈接地址。其中,正則表達(dá)式(Regular Expression,在代碼中常簡(jiǎn)寫為regex、 regexp或RE),又稱正規(guī)表示法或常規(guī)表示法,計(jì)算機(jī)科學(xué)的一個(gè)概念。正則表達(dá)式使用單 個(gè)字符串來(lái)描述、匹配一系列符合某個(gè)句法規(guī)則的字符串。在很多文本編輯器里,正則表達(dá) 式通常被用來(lái)檢索、替換那些符合某個(gè)模式的文本。在本發(fā)明實(shí)施例中,建立正則表達(dá)式字 符串如下:
[0化6]
[0057] 地址校正模塊用于識(shí)別該網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,從存儲(chǔ)模塊存儲(chǔ)的本地文本 字符串中獲取正確字符,通過(guò)正確字符對(duì)該網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置進(jìn)行校正,生成正確 的網(wǎng)絡(luò)鏈接地址,并刪除郵件文本字符流中錯(cuò)誤的網(wǎng)絡(luò)鏈接地址,將正確的網(wǎng)絡(luò)鏈接地址 保存在郵件文本字符流中,并根據(jù)正確的網(wǎng)絡(luò)鏈接地址進(jìn)行鏈接操作;其中,正確網(wǎng)絡(luò)鏈接 地址的生成方式包括:通常網(wǎng)絡(luò)鏈接地址錯(cuò)誤的原因在于:由于編程或其他原因?qū)е戮W(wǎng)絡(luò) 鏈接地址中的部分字符錯(cuò)誤,使得網(wǎng)絡(luò)鏈接地址無(wú)法正常加載,本發(fā)明實(shí)施例根據(jù)W邸地址 協(xié)議標(biāo)準(zhǔn)從郵件文本字符流中對(duì)正確的網(wǎng)絡(luò)鏈接地址進(jìn)行識(shí)別,找出錯(cuò)誤網(wǎng)絡(luò)鏈接地址的 出錯(cuò)位置,并在本地文本字符串中獲取正確字符,將獲取的正確字符與錯(cuò)誤網(wǎng)絡(luò)鏈接地址 中出錯(cuò)位置的字符進(jìn)行替換,從而生成正確的網(wǎng)絡(luò)鏈接地址。例如,錯(cuò)誤的網(wǎng)絡(luò)鏈接地址 為:<a bef=" sda"〉www. baidu. com</a>,經(jīng)過(guò)系統(tǒng)識(shí)別后,找出該網(wǎng)絡(luò)鏈接地址中的出錯(cuò) 位置,并從文本字符串中獲取正確字符,通過(guò)正確字符對(duì)網(wǎng)絡(luò)鏈接地址中的出錯(cuò)位置的自 己進(jìn)行替換,替換后的網(wǎng)絡(luò)鏈接地址為:<a虹ef = ht1:p://www.baidu.com〉www.baidu.com </a〉,用戶可通過(guò)替換后的網(wǎng)絡(luò)鏈接地址進(jìn)行正常鏈接操作。
[0058] 第二判斷模塊用于判斷郵件文本字符流中是否存在兩個(gè)W上的網(wǎng)絡(luò)鏈接地址,如 果存在兩個(gè)W上的網(wǎng)絡(luò)鏈接地址,則通過(guò)地址判斷模塊重新判斷郵件文本字符流中是否還 存在錯(cuò)誤網(wǎng)絡(luò)鏈接地址,直到遍歷完郵件文本字符流中的所有網(wǎng)絡(luò)鏈接地址;如果不存在 兩個(gè)W上的網(wǎng)絡(luò)鏈接地址,結(jié)束本次校正操作。
[0059] 本發(fā)明實(shí)施例的網(wǎng)頁(yè)地址校正方法及系統(tǒng)在接收到電子郵件后,通過(guò)郵件文本字 符流判斷該電子郵件中是否存在網(wǎng)絡(luò)鏈接地址,如果存在網(wǎng)絡(luò)鏈接地址,則進(jìn)一步檢測(cè)存 在的網(wǎng)絡(luò)鏈接地址是否有效,如果網(wǎng)絡(luò)鏈接地址錯(cuò)誤,則根據(jù)W邸地址協(xié)議標(biāo)準(zhǔn)找出錯(cuò)誤網(wǎng) 絡(luò)鏈接地址的出錯(cuò)位置,并在本地文本字符串中獲取正確字符,將獲取的正確字符與錯(cuò)誤 網(wǎng)絡(luò)鏈接地址中出錯(cuò)位置的字符進(jìn)行替換,從而生成正確的網(wǎng)絡(luò)鏈接地址。本發(fā)明操作簡(jiǎn) 單,無(wú)需用戶手動(dòng)操作,有利于提升用戶的使用體驗(yàn)。
[0060]上述實(shí)施例為本發(fā)明較佳的實(shí)施方式,但本發(fā)明的實(shí)施方式并不受上述實(shí)施例的 限制,其他的任何未背離本發(fā)明的精神實(shí)質(zhì)與原理下所作的改變、修飾、替代、組合、簡(jiǎn)化, 均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種網(wǎng)頁(yè)地址校正方法,其特征在于:包括以下步驟: 步驟100:接收電子郵件,并獲取郵件文本字符流; 步驟101:判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,如果郵件 文本字符流的網(wǎng)絡(luò)鏈接地址是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,執(zhí)行步驟102; 步驟102 :識(shí)別錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,并對(duì)該錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置進(jìn) 行校正,生成正確的網(wǎng)絡(luò)鏈接地址。2. 根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)地址校正方法,其特征在于:所述步驟100還包括:將獲取 的郵件文本字符流保存在本地文本字符串中,并顯示郵件文本字符流。3. 根據(jù)權(quán)利要求2所述的網(wǎng)頁(yè)地址校正方法,其特征在于:所述步驟101還包括:判斷郵 件文本字符流中是否存在網(wǎng)絡(luò)鏈接地址,如果郵件文本字符流中不存在網(wǎng)絡(luò)鏈接地址,略 過(guò)該郵件文本字符流不做校正處理;如果郵件文本字符流中存在網(wǎng)絡(luò)鏈接地址,則判斷郵 件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址。4. 根據(jù)權(quán)利要求3所述的網(wǎng)頁(yè)地址校正方法,其特征在于:所述判斷郵件文本字符流中 是否存在網(wǎng)絡(luò)鏈接地址的判斷方式為:在郵件文本中有指定鏈接地址的錨點(diǎn),通過(guò)解析鏈 接地址的錨點(diǎn)判斷郵件文本字符流中是否存在網(wǎng)絡(luò)鏈接地址。5. 根據(jù)權(quán)利要求1或4所述的網(wǎng)頁(yè)地址校正方法,其特征在于:所述判斷郵件文本字符 流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址的判斷方式為:建立正則表達(dá)式字符串,通 過(guò)正則表達(dá)式字符串過(guò)濾郵件文本,對(duì)網(wǎng)絡(luò)鏈接地址進(jìn)行匹配,從而確定該網(wǎng)絡(luò)鏈接地址 是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址。6. 根據(jù)權(quán)利要求2所述的網(wǎng)頁(yè)地址校正方法,其特征在于:在所述步驟102中,所述生成 正確的網(wǎng)絡(luò)鏈接地址具體包括:根據(jù)WEB地址協(xié)議標(biāo)準(zhǔn)從郵件文本字符流中對(duì)正確的網(wǎng)絡(luò) 鏈接地址進(jìn)行識(shí)別,找出錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,在本地文本字符串中獲取正確字 符,將獲取的正確字符與錯(cuò)誤網(wǎng)絡(luò)鏈接地址中出錯(cuò)位置的字符進(jìn)行替換,生成正確的網(wǎng)絡(luò) 鏈接地址;并刪除郵件文本字符流中錯(cuò)誤的網(wǎng)絡(luò)鏈接地址,將正確的網(wǎng)絡(luò)鏈接地址保存在 郵件文本字符流中。7. -種網(wǎng)頁(yè)地址校正系統(tǒng),其特征在于,包括郵件接收模塊、地址判斷模塊和地址校正 模塊,所述郵件接收模塊用于接收電子郵件,并獲取郵件文本字符流;所述地址判斷模塊用 于判斷郵件文本字符流中的網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,如果郵件文本字符流 的網(wǎng)絡(luò)鏈接地址是錯(cuò)誤網(wǎng)絡(luò)鏈接地址,通過(guò)地址校正模塊對(duì)錯(cuò)誤網(wǎng)絡(luò)鏈接地址進(jìn)行校正; 所述地址校正模塊用于識(shí)別錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,并對(duì)該錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出 錯(cuò)位置進(jìn)行校正,生成正確的網(wǎng)絡(luò)鏈接地址。8. 根據(jù)權(quán)利要求7所述的網(wǎng)頁(yè)地址校正系統(tǒng),其特征在于:還包括存儲(chǔ)模塊和顯示模 塊,所述存儲(chǔ)模塊用于將獲取的郵件文本字符流保存在本地文本字符串中;所述顯示模塊 用于顯示郵件文本字符流。9. 根據(jù)權(quán)利要求7或8所述的網(wǎng)頁(yè)地址校正系統(tǒng),其特征在于:還包括第一判斷模塊,第 一判斷模塊用于判斷郵件文本字符流中是否存在網(wǎng)絡(luò)鏈接地址,如果郵件文本字符流中不 存在網(wǎng)絡(luò)鏈接地址,略過(guò)該郵件文本字符流不做校正處理;如果郵件文本字符流中存在網(wǎng) 絡(luò)鏈接地址,通過(guò)地址判斷模塊判斷網(wǎng)絡(luò)鏈接地址是否是錯(cuò)誤網(wǎng)絡(luò)鏈接地址。10. 根據(jù)權(quán)利要求8所述的網(wǎng)頁(yè)地址校正系統(tǒng),其特征在于:所述地址校正模塊生成正 確的網(wǎng)絡(luò)鏈接地址具體包括:根據(jù)WEB地址協(xié)議標(biāo)準(zhǔn)從郵件文本字符流中對(duì)正確的網(wǎng)絡(luò)鏈 接地址進(jìn)行識(shí)別,找出錯(cuò)誤網(wǎng)絡(luò)鏈接地址的出錯(cuò)位置,在本地文本字符串中獲取正確字符, 將獲取的正確字符與錯(cuò)誤網(wǎng)絡(luò)鏈接地址中出錯(cuò)位置的字符進(jìn)行替換,生成正確的網(wǎng)絡(luò)鏈接 地址;并刪除郵件文本字符流中錯(cuò)誤的網(wǎng)絡(luò)鏈接地址,將正確的網(wǎng)絡(luò)鏈接地址保存在郵件 文本字符流中。
【文檔編號(hào)】G06F17/30GK106021304SQ201610291185
【公開日】2016年10月12日
【申請(qǐng)日】2016年5月5日
【發(fā)明人】常建軍
【申請(qǐng)人】樂(lè)視控股(北京)有限公司, 樂(lè)視移動(dòng)智能信息技術(shù)(北京)有限公司