圖片的校正方法及裝置的制造方法
【專利摘要】本發(fā)明適用于智能設備技術領域,提供了一種圖片的校正方法及裝置,所述校正方法包括:在拍照提問功能下,獲取相機拍攝的圖片;對所述圖片進行直線檢測,并根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。本發(fā)明解決了圖片方向傾斜的問題,進而降低了拍照提問功能中題目識別及截取的難度,提高了題目識別的準確度。
【專利說明】
圖片的校正方法及裝置
技術領域
[0001]本發(fā)明屬于智能設備技術領域,尤其涉及一種圖片的校正方法及裝置。
【背景技術】
[0002]現(xiàn)有的拍照提問步驟包括:獲取拍攝的圖片一一從圖片中截取題目一一上傳題目一一搜索匹配題目一一反饋答案。然而,當用戶拍攝的方向傾斜時,所述得到的圖片也會傾斜,圖片中的字符通常是沒有平行于顯示屏的上下邊界的,對此類傾斜的圖片進行題目識別及截取的難度大,題目識別的準確度低,有時候甚至無法識別出題目。
【發(fā)明內(nèi)容】
[0003]鑒于此,本發(fā)明實施例提供一種圖片的校正方法及裝置,以解決現(xiàn)有拍照提問功能中圖片方向傾斜的問題。
[0004]第一方面,提供了一種圖片的校正方法,所述校正方法包括:
[0005]在拍照提問功能下,獲取相機拍攝的圖片;
[0006]對所述圖片進行直線檢測,并根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。
[0007]第二方面,提供了一種圖片的校正裝置,所述校正裝置包括:
[0008]獲取模塊,用于在拍照提問功能下,獲取相機拍攝的圖片;
[0009]校正模塊,用于對所述圖片進行直線檢測,并根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。
[0010]與現(xiàn)有技術相比,本發(fā)明實施例在拍照提問功能的拍照環(huán)節(jié)中增加了對拍攝得到的圖片進行方向校正;通過在拍照提問功能下,獲取相機拍攝的圖片;對所述圖片進行直線檢測,然后根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上;從而解決了圖片的方向傾斜的問題,使得校正后的圖片中的字符平行于顯示屏的上邊界或下邊界,進而降低了拍照提問功能中題目識別及截取的難度,提高了題目識別的準確度。
【附圖說明】
[0011]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他附圖。
[0012]圖1是本發(fā)明實施例提供的圖片的校正方法的實現(xiàn)流程圖;
[0013]圖2是本發(fā)明另一實施例提供的圖片的校正方法的實現(xiàn)流程圖;
[0014]圖3是本發(fā)明另一實施例提供的圖片的校正方法的實現(xiàn)流程圖;
[0015]圖4是本發(fā)明實施例提供的圖片的校正裝置的組成結構圖。
【具體實施方式】
[0016]為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0017]本發(fā)明實施例在拍照提問功能的拍照環(huán)節(jié)中增加了對拍攝得到的圖片進行方向校正;通過在拍照提問功能下,獲取相機拍攝的圖片;對所述圖片進行直線檢測,然后根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上;從而解決了圖片的方向傾斜的問題,使得校正后的圖片中的字符平行于顯示屏的上邊界或下邊界,進而降低了拍照提問功能中題目識別及截取的難度,提高了題目識別的準確度。本發(fā)明實施例還提供了相應的裝置,以下分別進行詳細的說明。
[0018]圖1示出了本發(fā)明實施例提供的圖片的校正方法的實現(xiàn)流程。
[0019]在本發(fā)明實施例中,所述校正方法應用于智能設備,所述智能設備包括但不限于智能手機、平板電腦、計算機、家教機等。所述智能設備上設置有相機,能夠進行拍攝并獲取圖片。
[0020]參閱圖1,所述校正方法包括:
[0021]在步驟SlOl中,在拍照提問功能下,獲取相機拍攝的圖片。
[0022]本發(fā)明實施例在智能設備啟動拍照提問功能時,啟動相機以供用戶拍攝待提問的題目。智能設備根據(jù)用戶的操作進行拍攝,得到包含待提問的題目的圖片。
[0023]在步驟S102中,對所述圖片進行直線檢測,并根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。
[0024]在這里,待提問的題目中同一行的字符都是在同一直線上的。本發(fā)明實施例利用直線檢測,擬合出所述圖片中任意一行字符對應的直線。所述直線反應了該行字符的傾斜方向,即圖片的傾斜方向;然后根據(jù)所述直線的傾斜方向來旋轉圖片,以校正圖片的方向,使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上;從而解決了圖片的方向傾斜的問題,使得校正后的圖片中的字符為人眼視覺中的正方向,進而降低了拍照提問功能中題目識別及截取的難度,提高了題目識別的準確度。
[0025]作為本發(fā)明的一個優(yōu)選實例,所述直線檢測優(yōu)選為霍夫直線檢測。圖2示出了本發(fā)明另一實施例提供的圖片的校正方法的實現(xiàn)流程。
[0026]參閱圖2,所述圖片的校正方法包括:
[0027]在步驟S201中,在拍照提問功能下,獲取相機拍攝的圖片。
[0028]在步驟S202中,對所述圖片進行變換,得到所述圖片的頻域圖像。
[0029]在這里,所述變換為從時域到頻域的變換,優(yōu)選為傅里葉變換。本發(fā)明實施例通過對所述圖片進行傅里葉變換,以分離實部和虛部,得到所述圖片的頻域圖像。
[0030]在步驟S203中,對所述頻域圖像進行直線檢測,得到經(jīng)過所述圖片中心的直線。
[0031]在這里,所述直線檢測為霍夫直線檢測。本發(fā)明實施例利用頻域圖像中的幅度數(shù)據(jù),通過霍夫直線檢測,擬合出所述圖片中每行字符對應的直線,并選取經(jīng)過圖片中心的直線。所述直線反映了該行字符的傾斜方向,即圖片的傾斜方向。
[0032]在步驟S204中,計算所述直線相對于顯示屏下邊界之間的傾斜角度。
[0033]在步驟S205中,按照所述傾斜角度旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。
[0034]在得到反映圖片的傾斜方向的直線之后,計算所述直線相對于顯示屏的下邊界的傾斜角度,從而得到所述圖片的傾斜角度。按照所述傾斜角度來旋轉整個圖片,以校正圖片的方向,使得校正后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上,即圖片中的字符方向為人眼視覺中的正方向,從而解決了圖片傾斜的問題,進而降低了拍照提問功能中題目識別及截取的難度,提高了題目識別的準確度。
[0035]作為本發(fā)明的另一個優(yōu)選示例,為了優(yōu)化圖片的顯示效果,本發(fā)明實施例在進行傅里葉變換前,先對所述圖片進行放大操作。示例性地,圖3示出了本發(fā)明另一實施例提供的圖片的校正方法的實現(xiàn)流程。
[0036]參閱圖3,所述校正方法包括:
[0037]在步驟S301中,在拍照提問功能下,獲取相機拍攝的圖片。
[0038]在步驟S302中,放大所述圖片。
[0039]在本發(fā)明實施例中,圖片的放大尺寸與智能設備上的顯示屏的顯示區(qū)域對應。這里的放大是指在圖片中增加像素點,并設置所述像素點的像素值為臨近的像素點的像素值。通過放大圖片,增加圖片中的像素點,避免了像素過低時圖片中存在的鋸齒樣,從而優(yōu)化了圖片的顯示效果。
[0040]在步驟S303中,對所述圖片進行變換,得到所述圖片的頻域圖像。
[0041]在這里,所述變換為從時域到頻域的變換,優(yōu)選為傅里葉變換。本發(fā)明實施例通過對所述圖片進行傅里葉變換,以分離實部和虛部,得到所述圖片的頻域圖像。
[0042]在步驟S304中,對所述頻域圖像進行直線檢測,得到經(jīng)過所述圖片中心的直線。
[0043]在這里,所述直線檢測為霍夫直線檢測。本發(fā)明實施例利用頻域圖像中的幅度數(shù)據(jù),通過霍夫直線檢測,擬合出所述圖片中每行字符對應的直線,并選取經(jīng)過圖片中心的直線。所述直線反映了該行字符的傾斜方向,即圖片的傾斜方向。
[0044]在步驟S305中,計算所述直線相對于顯示屏下邊界之間的傾斜角度。
[0045]在步驟S306中,按照所述傾斜角度旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。
[0046]作為本發(fā)明的另一個優(yōu)選示例,在圖1、圖2和圖3實施例所述的圖片的校正方法中,在旋轉所述圖片后,所述校正方法還可以包括:
[0047]顯示旋轉后的所述圖片。
[0048]本發(fā)明示例通過顯示校正后的圖片,使得用戶能夠對圖片的校正效果進行預覽,且方便了用戶查驗、確認所拍攝的待提問的題目。
[0049]需要說明的是,本發(fā)明上述實施例中所述的字符包括但不限于文字、字母或者數(shù)字。
[0050]綜上所述,本發(fā)明實施例在拍照提問功能的拍照環(huán)節(jié)中增加了對拍攝得到的圖片進行方向校正;通過在拍照提問功能下,獲取相機拍攝的圖片;對所述圖片進行直線檢測,并根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上;從而解決了圖片的方向傾斜的問題,使得校正后的圖片中的字符平行于顯示屏的上邊界或下邊界,進而降低了拍照提問功能中題目識別及截取的難度,提高了題目識別的準確度。
[0051]圖4示出了本發(fā)明實施例提供的圖片的校正裝置的組成結構,為了便于說明,僅示出了與本發(fā)明實施例相關的部分。
[0052]在本發(fā)明實施例中,所述圖片的校正裝置用于實現(xiàn)上述圖1或圖2實施例中所述的圖片的校正方法,可以是內(nèi)置于智能設備的軟件單元、硬件單元或者軟硬件結合的單元。所述智能設備包括但不限于智能手機、平板電腦、計算機、家教機等。所述智能設備上設置有相機,能夠進行拍攝并獲取圖片。
[°°53] 參閱圖4,所述校正裝置包括:
[0054]獲取模塊41,用于在拍照提問功能下,獲取相機拍攝的圖片;
[0055]校正模塊42,用于對所述圖片進行直線檢測,并根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。
[0056]進一步地,所述直線檢測優(yōu)選為霍夫直線檢測,所述校正模塊42包括:
[0057]變換單元421,用于對所述圖片進行變換,得到所述圖片的頻域圖像;
[0058]檢測單元422,用于對所述頻域圖像進行直線檢測,得到經(jīng)過所述圖片中心的直線;
[0059]計算單元423,用于計算所述直線相對于顯示屏下邊界之間的傾斜角度;
[0060]旋轉單元424,用于按照所述傾斜角度旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。
[0061 ]在這里,所述變換為從時域到頻域的變換,優(yōu)選為傅里葉變換。
[0062]進一步地,所述變換模塊還包括:
[0063]放大單元425,用于放大所述圖片。
[0064]通過在對所述圖片進行變換前放大所述圖片,增加圖片中的像素點,避免了像素過低時圖片中存在的鋸齒樣,從而優(yōu)化了圖片的顯示效果。
[0065]進一步地,所述校正裝置還包括:
[0066]顯示模塊43,用于顯示旋轉后的所述圖片。
[0067]本發(fā)明實施例通過顯示校正后的圖片,使得用戶能夠對圖片的校正效果進行預覽,且方便了用戶查驗、確認所拍攝的待提問的題目。
[0068]需要說明的是,本發(fā)明實施例所述的字符包括但不限于文字、字母或者數(shù)字。本實施例中的裝置可以用于實現(xiàn)上述方法實施例中的全部技術方案,其各個功能模塊的功能可以根據(jù)上述方法實施例中的方法具體實現(xiàn),其具體實現(xiàn)過程可參照上述實例中的相關描述,此處不再贅述。
[0069]本發(fā)明實施例在拍照提問功能的拍照環(huán)節(jié)中增加了對拍攝得到的圖片進行方向校正;通過在拍照提問功能下,獲取相機拍攝的圖片;對所述圖片進行直線檢測,并根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上;從而解決了圖片的方向傾斜的問題,使得校正后的圖片中的字符平行于顯示屏的上邊界或下邊界,進而降低了拍照提問功能中題目識別及截取的難度,提高了題目識別的準確度。
[0070]本領域普通技術人員可以意識到,結合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計算機軟件和電子硬件的結合來實現(xiàn)。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術方案的特定應用和設計約束條件。專業(yè)技術人員可以對每個特定的應用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應認為超出本發(fā)明的范圍。
[0071]所屬領域的技術人員可以清楚地了解到,為描述的方便和簡潔,上述描述的裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。
[0072]在本申請所提供的幾個實施例中,應該理解到,所揭露的圖片的校正方法及裝置,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述模塊、單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。
[0073]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
[0074]另外,在本發(fā)明各個實施例中的各功能單元、模塊可以集成在一個處理單元中,也可以是各個單元、模塊單獨物理存在,也可以兩個或兩個以上單元、模塊集成在一個單元中。
[0075]所述功能如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質中?;谶@樣的理解,本發(fā)明的技術方案本質上或者說對現(xiàn)有技術做出貢獻的部分或者該技術方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、移動硬盤、只讀存儲器(R0M,Read-0nly Memory)、隨機存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質。
[0076]以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發(fā)明揭露的技術范圍內(nèi),可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應所述以權利要求的保護范圍為準。
【主權項】
1.一種圖片的校正方法,其特征在于,所述校正方法包括: 在拍照提問功能下,獲取相機拍攝的圖片; 對所述圖片進行直線檢測,并根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。2.如權利要求1所述的圖片的校正方法,其特征在于,所述對所述圖片進行直線檢測,并根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上包括: 對所述圖片進行變換,得到所述圖片的頻域圖像; 對所述頻域圖像進行直線檢測,得到經(jīng)過所述圖片中心的直線; 計算所述直線相對于顯示屏下邊界之間的傾斜角度; 按照所述傾斜角度旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。3.如權利要求2所述的圖片的校正方法,其特征在于,在對所述圖片進行變換,得到所述圖片的頻域圖像之前,所述校正方法還包括: 放大所述圖片。4.如權利要求1至3任一項所述的圖片的校正方法,其特征在于,所述校正方法還包括: 顯示旋轉后的所述圖片。5.如權利要求1至3任一項所述的圖片的校正方法,其特征在于,所述字符為文字、字母或者數(shù)字。6.—種圖片的校正裝置,其特征在于,所述校正裝置包括: 獲取模塊,用于在拍照提問功能下,獲取相機拍攝的圖片; 校正模塊,用于對所述圖片進行直線檢測,并根據(jù)直線檢測結果旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。7.如權利要求6所述的圖片的校正裝置,其特征在于,所述校正模塊包括: 變換單元,用于對所述圖片進行變換,得到所述圖片的頻域圖像; 檢測單元,用于對所述頻域圖像進行直線檢測,得到經(jīng)過所述圖片中心的直線; 計算單元,用于計算所述直線相對于顯示屏下邊界之間的傾斜角度; 旋轉單元,用于按照所述傾斜角度旋轉所述圖片,以使得旋轉后的圖片中的字符平行于所述顯示屏的上邊界/下邊界且所述字符的頂部朝向上。8.如權利要求7所述的圖片的校正裝置,其特征在于,所述變換模塊還包括: 放大單元,用于放大所述圖片。9.如權利要求6至8任一項所述的圖片的校正裝置,其特征在于,所述校正裝置還包括: 顯示模塊,用于顯示旋轉后的所述圖片。10.如權利要求6至8任一項所述的圖片的校正裝置,其特征在于,所述字符為文字、字母或者數(shù)字。
【文檔編號】G06F17/30GK105913061SQ201610286127
【公開日】2016年8月31日
【申請日】2016年4月29日
【發(fā)明人】張櫻
【申請人】廣東小天才科技有限公司