圖像文本識(shí)別的方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：39709641發(fā)布日期：2024-10-22 12:54閱讀：3來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

圖像文本識(shí)別的方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)與流程

本公開涉及文本識(shí)別領(lǐng)域，尤其涉及一種圖像文本識(shí)別的方法、裝置、設(shè)備、計(jì)算機(jī)存儲(chǔ)介質(zhì)及計(jì)算機(jī)程序產(chǎn)品。

背景技術(shù)：

1、隨著科技的不斷發(fā)展，人們利用科技在不同的領(lǐng)域進(jìn)行探索研究。文本識(shí)別領(lǐng)域作為當(dāng)下熱門的領(lǐng)域，主要研究如何利用計(jì)算機(jī)對(duì)圖像中的字符進(jìn)行識(shí)別。

2、相關(guān)技術(shù)中，利用光學(xué)字符識(shí)別(optical?character?recognition，ocr)等技術(shù)，能夠識(shí)別單個(gè)文本區(qū)域，且文本排列規(guī)整的文本圖像。但是，相關(guān)技術(shù)中，采用ocr等方法在識(shí)別圖像文本時(shí)，僅能對(duì)每個(gè)文本區(qū)域進(jìn)行分別掃描，從而導(dǎo)致每個(gè)文本區(qū)域識(shí)別出的文本在最終組合時(shí)難以準(zhǔn)確的完成語(yǔ)義再現(xiàn)。

技術(shù)實(shí)現(xiàn)思路

1、本公開實(shí)施例提供一種圖像文本識(shí)別的方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)，能夠提高圖像文本識(shí)別出的語(yǔ)義的準(zhǔn)確性。

2、第一方面，本公開實(shí)施例提供一種圖像文本識(shí)別的方法，方法包括：

3、獲取多個(gè)子文本區(qū)域；其中，多個(gè)子文本區(qū)域的組合面積與第一文本區(qū)域的面積相等；

4、分別獲取多個(gè)子文本區(qū)域的多個(gè)組合方式對(duì)應(yīng)的適應(yīng)度；選取適應(yīng)度小于預(yù)設(shè)適應(yīng)度閾值的目標(biāo)適應(yīng)度對(duì)應(yīng)的目標(biāo)組合方式；

5、對(duì)利用目標(biāo)組合方式組合多個(gè)子文本區(qū)域得到的目標(biāo)文本區(qū)域進(jìn)行文本識(shí)別，得到目標(biāo)文本信息。

6、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中，獲取多個(gè)子文本區(qū)域，包括：

7、獲取待識(shí)別的圖像，圖像包括多元素文本的區(qū)域；

8、對(duì)圖像進(jìn)行文本區(qū)域識(shí)別，識(shí)別得到圖像中包括文本的第一文本區(qū)域；

9、利用預(yù)設(shè)選取框，通過(guò)覆蓋第一文本區(qū)域的方式，將第一文本區(qū)域劃分為多個(gè)子文本區(qū)域。

10、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中，對(duì)圖像進(jìn)行文本區(qū)域識(shí)別，識(shí)別出圖像中包括文本的第一文本區(qū)域之前，該方法還包括：

11、對(duì)圖像進(jìn)行灰度處理，得到灰度處理后的第一目標(biāo)圖像。

12、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中，對(duì)圖像進(jìn)行文本區(qū)域識(shí)別，識(shí)別出圖像中包括文本的第一文本區(qū)域，包括：

13、獲取第一目標(biāo)圖像中灰度值滿足灰度閾值的第一目標(biāo)覆蓋區(qū)域，第一目標(biāo)覆蓋區(qū)域包括文本信息；

14、利用選取框，通過(guò)不重復(fù)覆蓋且相鄰的選取框之間相交或相切的方式，將選取框覆蓋至第一目標(biāo)覆蓋區(qū)域，并獲取包括文本信息的文本框覆蓋的區(qū)域，以得到預(yù)組合區(qū)域；

15、在預(yù)組合區(qū)域的任意邊界點(diǎn)的連線在預(yù)覆蓋區(qū)域內(nèi)的情況下，組合預(yù)組合區(qū)域，得到第一文本區(qū)域。

16、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中，在預(yù)組合區(qū)域的任意邊界點(diǎn)的連線在預(yù)覆蓋區(qū)域內(nèi)的情況下，組合預(yù)組合區(qū)域，得到第一文本區(qū)域，包括：

17、在預(yù)組合區(qū)域的任意邊界點(diǎn)的連線在預(yù)覆蓋區(qū)域內(nèi)的情況下，利用選取框覆蓋預(yù)組合區(qū)域中，確定預(yù)組合區(qū)域被覆蓋中的灰度面積和被覆蓋區(qū)域的面積；

18、計(jì)算灰度面積與被覆蓋面積的比值；

19、在比值小于或等于密集度閾值的情況下，組合預(yù)組合區(qū)域得到第一文本區(qū)域。

20、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中，在分別獲取多個(gè)子文本區(qū)域的多個(gè)組合方式對(duì)應(yīng)的適應(yīng)度之前，該方法還包括：

21、通過(guò)目標(biāo)編碼方式對(duì)多個(gè)子文本區(qū)域編碼，得到編碼后的多個(gè)子文本區(qū)域；

22、通過(guò)判斷子文本區(qū)域與目標(biāo)區(qū)域邊界是否有交界的方式，對(duì)編碼后的多個(gè)子文本區(qū)域二次編碼，得到二次編碼后的多個(gè)子文本區(qū)域；

23、分別獲取多個(gè)子文本區(qū)域的多個(gè)組合方式對(duì)應(yīng)的適應(yīng)度，包括：

24、分別獲取二次編碼后的多個(gè)子文本區(qū)域的多個(gè)組合方式對(duì)應(yīng)的適應(yīng)度。

25、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中，選取適應(yīng)度小于預(yù)設(shè)適應(yīng)度閾值的目標(biāo)適應(yīng)度對(duì)應(yīng)的目標(biāo)組合方式，包括：

26、選取多個(gè)組合方式對(duì)應(yīng)的適應(yīng)度中的最小適應(yīng)度；

27、比較最小適應(yīng)度和適應(yīng)度閾值，得到比較結(jié)果；

28、在比較結(jié)果包括最小適應(yīng)度小于適應(yīng)度閾值的情況下，獲取最小適應(yīng)度對(duì)應(yīng)的目標(biāo)組合方式。

29、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中，比較最小適應(yīng)度和適應(yīng)度閾值，得到比較結(jié)果之后，該方法還包括：

30、在比較結(jié)果包括最小適應(yīng)度大于或等于適應(yīng)度閾值的情況下，根據(jù)最小適應(yīng)度更新歷史最小適應(yīng)度和多個(gè)組合方式對(duì)應(yīng)的適應(yīng)度，得到更新后的歷史最小適應(yīng)度和多個(gè)組合方式對(duì)應(yīng)的適應(yīng)度。

31、第二方面，本公開實(shí)施例提供了一種圖像文本識(shí)別的裝置，裝置包括：

32、獲取模塊，用于獲取多個(gè)子文本區(qū)域；其中，多個(gè)子文本區(qū)域的組合面積與第一文本區(qū)域的面積相等；

33、獲取模塊，還用于分別獲取多個(gè)子文本區(qū)域的多個(gè)組合方式對(duì)應(yīng)的適應(yīng)度；

34、選取模塊，用于選取適應(yīng)度小于預(yù)設(shè)適應(yīng)度閾值的目標(biāo)適應(yīng)度對(duì)應(yīng)的目標(biāo)組合方式；

35、識(shí)別模塊，用于對(duì)利用目標(biāo)組合方式組合多個(gè)子文本區(qū)域得到的目標(biāo)文本區(qū)域進(jìn)行文本識(shí)別，得到目標(biāo)文本信息。

36、第三方面，本公開實(shí)施例提供了一種圖像文本識(shí)別的設(shè)備，設(shè)備包括處理器，以及存儲(chǔ)有計(jì)算機(jī)程序指令的存儲(chǔ)器；處理器讀取并執(zhí)行計(jì)算機(jī)程序指令，以實(shí)現(xiàn)如第一方面的任意一項(xiàng)的圖像文本識(shí)別的方法。

37、第四方面，本公開實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序指令，計(jì)算機(jī)程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面的任意一項(xiàng)的圖像文本識(shí)別的方法。

38、第五方面，本公開實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，計(jì)算機(jī)程序被處理其執(zhí)行時(shí)實(shí)現(xiàn)如第一方面的任意一項(xiàng)的圖像文本識(shí)別的方法。

39、本公開實(shí)施例提供的圖像文本識(shí)別的方法、裝置、設(shè)備、計(jì)算機(jī)存儲(chǔ)介質(zhì)及計(jì)算機(jī)程序產(chǎn)品，獲取多個(gè)子文本區(qū)域，再分別獲取多個(gè)子文本區(qū)域的多個(gè)組合方式對(duì)應(yīng)的適應(yīng)度。根據(jù)目標(biāo)組合方式對(duì)多個(gè)子文本區(qū)域進(jìn)行組合得到目標(biāo)文本區(qū)域，對(duì)目標(biāo)文本區(qū)域進(jìn)行文本識(shí)別得到目標(biāo)文本信息，通過(guò)對(duì)第一文本區(qū)域進(jìn)行劃分，得到多個(gè)子文本區(qū)域，從多個(gè)子文本區(qū)域的所有組合方式的適應(yīng)度中選擇適應(yīng)度小于預(yù)設(shè)適應(yīng)度的目標(biāo)組合方式，其中，適應(yīng)度小于預(yù)設(shè)適應(yīng)度對(duì)應(yīng)的目標(biāo)組合方式是最優(yōu)的組合方式，基于目標(biāo)組合方式對(duì)多個(gè)子文本區(qū)域進(jìn)行組合能夠得到包含更準(zhǔn)確的文本信息的目標(biāo)文本區(qū)域，再對(duì)目標(biāo)文本區(qū)域進(jìn)行識(shí)別能夠有效提高圖像文本識(shí)別出的語(yǔ)義的準(zhǔn)確性。

技術(shù)特征：

1.一種圖像文本識(shí)別的方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述獲取多個(gè)子文本區(qū)域，包括：

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述對(duì)所述圖像進(jìn)行文本區(qū)域識(shí)別，識(shí)別得到所述圖像中包括文本的第一文本區(qū)域之前，所述方法還包括：

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述對(duì)所述圖像進(jìn)行文本區(qū)域識(shí)別，識(shí)別得到所述圖像中包括文本的第一文本區(qū)域，包括：

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，在所述預(yù)組合區(qū)域的任意邊界點(diǎn)的連線在預(yù)覆蓋區(qū)域內(nèi)的情況下，組合所述預(yù)組合區(qū)域，得到所述第一文本區(qū)域，包括：

6.根據(jù)權(quán)利要求1所述的方法，其特征在于，在所述分別獲取所述多個(gè)子文本區(qū)域的多個(gè)組合方式對(duì)應(yīng)的適應(yīng)度之前，所述方法還包括：

7.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述選取所述適應(yīng)度小于預(yù)設(shè)適應(yīng)度閾值的目標(biāo)適應(yīng)度對(duì)應(yīng)的目標(biāo)組合方式，包括：

8.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述比較所述最小適應(yīng)度和所述適應(yīng)度閾值，得到比較結(jié)果之后，所述方法還包括：

9.一種圖像文本識(shí)別的裝置，其特征在于，所述裝置包括：

10.一種圖像文本識(shí)別的設(shè)備，其特征在于，所述設(shè)備包括處理器，以及存儲(chǔ)有計(jì)算機(jī)程序指令的存儲(chǔ)器；所述處理器讀取并執(zhí)行所述計(jì)算機(jī)程序指令，以實(shí)現(xiàn)如權(quán)利要求1-8任意一項(xiàng)所述的圖像文本識(shí)別的方法。

11.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其特征在于，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序指令，所述計(jì)算機(jī)程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-8任意一項(xiàng)所述的圖像文本識(shí)別的方法。

12.一種計(jì)算機(jī)程序產(chǎn)品，其特征在于，包括計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理其執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-8任意一項(xiàng)所述的圖像文本識(shí)別的方法。

技術(shù)總結(jié)
本申請(qǐng)公開了一種圖像文本識(shí)別的方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)。其方法包括：獲取多個(gè)子文本區(qū)域，其中，多個(gè)子文本區(qū)域的組合面積與第一文本區(qū)域的面積相等。分別獲取多個(gè)子文本區(qū)域的多個(gè)組合方式對(duì)應(yīng)的適應(yīng)度；選取適應(yīng)度小于預(yù)設(shè)適應(yīng)度閾值的目標(biāo)適應(yīng)度對(duì)應(yīng)的目標(biāo)組合方式；根據(jù)目標(biāo)組合方式對(duì)多個(gè)子文本區(qū)域進(jìn)行組合得到目標(biāo)文本區(qū)域；對(duì)目標(biāo)文本區(qū)域進(jìn)行文本識(shí)別得到目標(biāo)文本信息。本公開通過(guò)選取目標(biāo)適應(yīng)度對(duì)應(yīng)的組合方式，能夠得到包含更準(zhǔn)確的文本信息的目標(biāo)文本區(qū)域，再對(duì)目標(biāo)文本區(qū)域進(jìn)行識(shí)別能夠有效提高圖像文本識(shí)別出的語(yǔ)義的準(zhǔn)確性。

技術(shù)研發(fā)人員：張寅,劉曉暢
受保護(hù)的技術(shù)使用者：中國(guó)移動(dòng)通信集團(tuán)安徽有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/10/21

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張寅,劉曉暢
技術(shù)所有人：中國(guó)移動(dòng)通信集團(tuán)安徽有限公司
我是此專利的發(fā)明人

上一篇：一種接地開關(guān)操作聯(lián)鎖機(jī)構(gòu)的制作方法
上一篇：后翻蓋式省電型電子價(jià)簽的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

圖像文本識(shí)別的方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)與流程

圖像文本識(shí)別的方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)與流程