JP5500480B2 - Form recognition device and form recognition method - Google Patents

Form recognition device and form recognition method Download PDF

Info

Publication number
JP5500480B2
JP5500480B2 JP2010143969A JP2010143969A JP5500480B2 JP 5500480 B2 JP5500480 B2 JP 5500480B2 JP 2010143969 A JP2010143969 A JP 2010143969A JP 2010143969 A JP2010143969 A JP 2010143969A JP 5500480 B2 JP5500480 B2 JP 5500480B2
Authority
JP
Japan
Prior art keywords
stamp
character
image
unit
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010143969A
Other languages
Japanese (ja)
Other versions
JP2012008791A (en
Inventor
利昇 三好
広 新庄
健 永崎
和樹 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Information and Telecommunication Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information and Telecommunication Engineering Ltd filed Critical Hitachi Information and Telecommunication Engineering Ltd
Priority to JP2010143969A priority Critical patent/JP5500480B2/en
Publication of JP2012008791A publication Critical patent/JP2012008791A/en
Application granted granted Critical
Publication of JP5500480B2 publication Critical patent/JP5500480B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

本発明は、帳票に存在する文字を認識する帳票認識装置に関し、特に、帳票内に存在する押印の文字も認識する帳票認識装置に関する。   The present invention relates to a form recognition apparatus for recognizing characters existing in a form, and more particularly, to a form recognition apparatus for recognizing stamp characters existing in a form.

帳票認識技術は、ユーザが帳票を電子化するために用いられる。この場合には、ユーザは、例えば、一般企業、自治体、金融機関、保険機関、医療機関、及び教育機関等であり、帳票は、例えば、会計伝票、発注書、商品券、納付済通知書、給与報告書、注文書、保険契約書、総合振込書、源泉徴収書、健康診断書、診療報酬明細書、解答用紙、及び入学願書等である。   The form recognition technology is used for a user to digitize a form. In this case, the user is, for example, a general company, a local government, a financial institution, an insurance institution, a medical institution, an educational institution, etc., and the form is, for example, an accounting slip, a purchase order, a gift certificate, a paid notice, These include salary reports, order forms, insurance contracts, general transfer forms, withholding forms, health checkups, medical fees, answer sheets, and application forms.

帳票認識装置は、帳票から項目(例えば、ID欄、金融機関名欄、金額欄、商品名欄、個数欄、住所欄、及び名前欄等)を探索し、探索した項目に記載された文字を読み取ることによって、項目を電子化する。   The form recognition device searches items (for example, an ID field, a financial institution name field, an amount field, a product name field, a number field, an address field, a name field, etc.) from the form, and uses the characters described in the searched items. By reading, the item is digitized.

帳票認識装置によって実行される帳票認識処理について図15を用いて説明する。図15は、従来の帳票認識処理の説明図である。   A form recognition process executed by the form recognition apparatus will be described with reference to FIG. FIG. 15 is an explanatory diagram of a conventional form recognition process.

まず、帳票認識装置は、スキャナ等によって取得された帳票画像データから、各項目の文字列を抽出する。図15では、「支払金額」の文字列「7,890,123」が抽出された場合を例に説明する。   First, the form recognition apparatus extracts a character string of each item from form image data acquired by a scanner or the like. In FIG. 15, a case where the character string “7,890,123” of “payment amount” is extracted will be described as an example.

次に、帳票認識装置は、抽出された文字列から各文字を切り出す。図15では、抽出された文字列が「7」「,」「8」「9」「0」「,」「1」「2」「3」と一文字ごとに切り出される。そして、帳票認識装置は、切り出された各文字を認識することによって、帳票の項目に記載された文字を認識する。図15では、帳票認識装置は、「支払金額」の項目に「7,890,123」が記載されていたことを認識する。   Next, the form recognition apparatus cuts out each character from the extracted character string. In FIG. 15, the extracted character string is cut out for each character as “7” “,” “8” “9” “0” “,” “1” “2” “3”. Then, the form recognition device recognizes the characters described in the form item by recognizing each cut out character. In FIG. 15, the form recognition apparatus recognizes that “7,890,123” is described in the item “payment amount”.

なお、文字列から各文字を切り出す技術、及び、切り出された各文字を認識する技術は、非特許文献1及び非特許文献2に記載されている。   A technique for cutting out each character from a character string and a technique for recognizing each cut out character are described in Non-Patent Document 1 and Non-Patent Document 2.

帳票画像データから各項目を特定し、特定した項目に記載された文字列を抽出する帳票認識装置が知られている(例えば、特許文献1参照)。   A form recognition device that identifies each item from form image data and extracts a character string described in the identified item is known (for example, see Patent Document 1).

特許文献1に記載された帳票認識装置について説明する。   The form recognition apparatus described in Patent Document 1 will be described.

まず、帳票認識装置は、帳票画像データ中の枠を探索する。具体的には、帳票認識装置は、縦罫線及び横罫線を検出し、検出された縦罫線及び横罫線に囲まれた領域を枠として取り出す。次に、帳票認識装置は、取り出した枠内の黒画素を囲む最小矩形を切り出すことによって文字列を抽出する。帳票認識装置は、取り出した枠内の上の枠又は左の枠の文字を認識することによって、抽出された文字列の項目名を認識する。次に、帳票認識装置は、抽出された文字列から各文字を切り出し、切り出された各文字を認識することによって、項目に記載された文字を認識する。   First, the form recognition device searches for a frame in the form image data. Specifically, the form recognition apparatus detects vertical ruled lines and horizontal ruled lines, and takes out an area surrounded by the detected vertical ruled lines and horizontal ruled lines as a frame. Next, the form recognition apparatus extracts a character string by cutting out a minimum rectangle surrounding black pixels in the extracted frame. The form recognition apparatus recognizes the item name of the extracted character string by recognizing the characters in the upper frame or the left frame in the extracted frame. Next, the form recognition apparatus recognizes the characters described in the item by cutting out each character from the extracted character string and recognizing each cut out character.

帳票中に押印が存在するか否かを判定し、押印が存在する場合には、押印の位置及び輪郭を特定する技術が知られている(例えば、特許文献2参照)。また、帳票中の押印の文字を認識するための技術も知られている(例えば、特許文献3参照)。   A technique is known in which it is determined whether or not a stamp is present in a form, and if a stamp is present, the position and contour of the stamp are specified (for example, see Patent Document 2). A technique for recognizing a stamp character in a form is also known (see, for example, Patent Document 3).

帳票中の押印を検出し、押印中の文字を認識する技術は、払込書等において領収印の日付及び機関名等を読み取るために用いられる。例えば、日付と納付期限とを照合することによって、延滞の有無によって帳票を分類する等の目的に用いられる。   A technique for detecting a stamp in a form and recognizing a character in the stamp is used for reading a date of receipt, an institution name, and the like in a payment slip. For example, it is used for the purpose of classifying a form according to the presence or absence of arrears by checking a date and a due date.

特開2007−328820号公報JP 2007-328820 A 特開2009−25856号公報JP 2009-25856 A 特開平6−111066号公報JP-A-6-111066 Mohammed Cheriet、Nawwaf Kharma、Cheng lin Liu、Ching Suen、"Character Recognition Systems: A Guide for Students and Practitioners"、Wiley-Interscience、2007年Mohammed Cheriet, Nawwaf Kharma, Cheng lin Liu, Ching Suen, "Character Recognition Systems: A Guide for Students and Practitioners", Wiley-Interscience, 2007 石井健一郎、上田修功、前田英作、村瀬洋、「わかりやすいパターン認識」、オーム社出版局、1998年8月Kenichiro Ishii, Noriyoshi Ueda, Eisaku Maeda, Hiroshi Murase, “Easy-to-understand pattern recognition”, Ohm Publishing House, August 1998

従来の帳票認識装置では、押印の特性が要因となり、押印中の文字列の探索が困難となっていた。押印の特性とは、例えば、帳票内の押印が押印されるべき位置からずれて押印され、帳票の予め印刷されている部分(プレ印刷部分)と重複してしまうこと、押印が傾いてなされること、インクの濃淡によって押印及び押印中の文字にかすれ及びつぶれが発生して、押印及び押印中の文字が劣化してしまうこと、並びに押印のインク及びプレ印刷部分のノイズが押印に混入してしまうこと等である。   In the conventional form recognition apparatus, it is difficult to search for a character string during the stamp due to the characteristics of the stamp. The characteristics of the stamp include, for example, that the stamp in the form is deviated from the position to be stamped and overlaps with a pre-printed portion (pre-printed portion) of the form, or the stamp is inclined. In addition, the darkness and darkness of the ink may cause blurring and crushing on the stamped characters and the stamped characters, and the stamped and stamped characters may be deteriorated. And so on.

また、押印中の文字がかすれたり、つぶれたりすることによって、帳票認識装置が押印中の文字を認識する精度が悪くなってしまう。   Further, when the character being stamped is faded or crushed, the accuracy of the form recognition device recognizing the character being stamped is deteriorated.

また、帳票認識装置が押印中の日付を認識する場合には、年月日を区別して、正確に認識する必要がある。ところが、帳票認識装置が年月日の区切り文字であるピリオドを認識することは、インクのかすれ及びノイズ等によって困難となる場合がある。例えば、かすれによって押印中の日付欄のピリオドが消失した場合、「02127」となり、帳票認識装置は、「02.1.27」か「02.12.7」かを区別できない。また、かすれにより、数字の一部が欠けることによって、帳票認識装置は、文字を誤って認識してしまう場合もある。例えば、「7」の上部の横線がかすれによって消失している場合には、帳票認識装置は「1」と誤読してしまう場合がある。以上のように、帳票認識装置が誤って文字を認識することを防止するために、信頼度の低い文字の認識を棄却(不読)する必要がある。   In addition, when the form recognition device recognizes the date being stamped, it is necessary to distinguish the date correctly and recognize it correctly. However, it may be difficult for the form recognizing device to recognize a period, which is a separator of year, month and day, due to ink fading and noise. For example, if the period in the date column being stamped disappears due to blurring, it becomes “02127”, and the form recognition device cannot distinguish between “02.1.27” and “02.2.12.7”. In addition, the form recognition apparatus may erroneously recognize characters due to the lack of some of the numbers due to fading. For example, when the horizontal line at the top of “7” disappears due to fading, the form recognition device may misread as “1”. As described above, in order to prevent the form recognition device from recognizing characters by mistake, it is necessary to reject (unread) recognition of characters with low reliability.

また、従来の帳票認識技術(例えば、特許文献1)では、帳票内に存在する文字列を切り出すために縦横罫線を用いて矩形枠を探索する。しかし、押印の場合には、押印中の文字が存在する文字領域が矩形枠でない場合、押印が傾いている場合、押印とプレ印刷とが重なっている場合等があり、従来の帳票認識技術を押印の文字認識には適用できない。   Further, in a conventional form recognition technique (for example, Patent Document 1), a rectangular frame is searched using vertical and horizontal ruled lines in order to cut out a character string existing in the form. However, in the case of stamping, there are cases where the character area where the character being stamped is not a rectangular frame, the stamping is tilted, the stamping and pre-printing overlap, etc. It cannot be applied to character recognition of stamps.

また、従来の押印認識技術(例えば、特許文献2及び特許文献3)は、背景色との分離ができないため、押印とプレ印刷とが重なっている場合には、押印に存在する文字と背景とが重なり、文字の認識が困難となる。また、従来の押印認識技術では、押印の傾きを補正するために、ある方向に射影したヒストグラムを用いるため、押印がかすれている場合には、傾き補正の精度が悪くなってしまったり、種々の方向のヒストグラムを計算するために処理時間がかかるという問題がある。   In addition, since the conventional stamp recognition technology (for example, Patent Document 2 and Patent Document 3) cannot be separated from the background color, if the stamp and pre-printing overlap, the character and background existing in the stamp are overlapped. Overlapping characters makes it difficult to recognize characters. In addition, in the conventional stamp recognition technology, a histogram projected in a certain direction is used to correct the inclination of the seal. There is a problem that processing time is required to calculate a histogram of directions.

また、領収印等の日付認識では、年を示す文字よりも、月及び日を示す文字をより正確に認識することが求められる。これは、応用上、数年前の帳票を混在して認識するケースよりも、同じ年の帳票を認識するケースの方が多いためである。   In addition, in date recognition such as a receipt, it is required to recognize characters indicating months and days more accurately than characters indicating years. This is because, in terms of application, there are more cases of recognizing forms of the same year than cases of recognizing forms of several years ago.

以上のように、本発明は、帳票内に存在する押印の文字を正確に認識する帳票認識装置を提供することを目的とする。   As described above, an object of the present invention is to provide a form recognizing apparatus that accurately recognizes a stamp character existing in a form.

本発明の代表的な一例を示せば、帳票を光学的に走査することによって得られた帳票画像を取得するイメージ入力部と、前記イメージ入力部によって取得された帳票画像から押印画像を検出する押印画像検出部と、前記押印画像の輪郭の色を示す押印色とその他の色とを分離する背景色分離部と、前記背景色分離部によって前記押印色が前記その他の色と分離された前記押印画像の傾きを補正する傾き補正部と、前記傾き補正部によって傾きが補正された前記押印画像から文字列を探索し、前記探索された文字列を切り出す文字列探索部と、前記文字列探索部によって切り出された文字列から、前記文字列を構成する各文字を切り出す文字切出部と、前記文字切出部によって切り出された各文字を認識し、前記文字列を構成するすべての文字を認識した結果を示す文字認識結果を算出し、前記認識された各文字の信頼度を算出する文字認識部と、前記文字認識部によって算出された文字認識結果から、予め指定された文字列形式に適合する文字認識結果を選択し、前記選択された文字認識結果に対する信頼度を前記文字認識部によって算出された各文字の信頼度に基づいて算出する知識処理部と、前記知識処理部によって選択された文字認識結果と当該文字認識結果の信頼度とに基づいて、前記知識処理部によって選択された文字認識結果を棄却するか否かを判定する棄却判定部と、前記棄却判定部によって前記文字認識部による文字認識結果が棄却された場合に、押印画像の文字を再度認識させるか否かを判定するリトライ判定部と、を備えることを特徴とする。   To show a typical example of the present invention, an image input unit that acquires a form image obtained by optically scanning a form, and a stamp that detects a stamp image from the form image acquired by the image input unit. An image detecting unit; a background color separating unit that separates a stamp color indicating the color of the outline of the stamped image from other colors; and the stamp in which the stamp color is separated from the other colors by the background color separating unit. An inclination correction unit that corrects an inclination of an image, a character string search unit that searches for a character string from the stamped image whose inclination is corrected by the inclination correction unit, and extracts the searched character string, and the character string search unit A character cutout unit that cuts out each character that constitutes the character string from the character string cut out by the step, and recognizes each character that is cut out by the character cutout unit, and all the characters that constitute the character string A character recognition result indicating a recognition result is calculated, a character recognition unit that calculates the reliability of each recognized character, and a character recognition result calculated by the character recognition unit is converted into a character string format designated in advance. A knowledge processing unit that selects a matching character recognition result and calculates a reliability for the selected character recognition result based on a reliability of each character calculated by the character recognition unit; and selected by the knowledge processing unit And a rejection determination unit that determines whether or not to reject the character recognition result selected by the knowledge processing unit based on the character recognition result and the reliability of the character recognition result, and the character recognition by the rejection determination unit. A retry determination unit that determines whether or not to recognize the character of the stamped image again when the character recognition result by the unit is rejected.

本発明によれば、帳票内に存在する押印の文字を正確に認識できる。   According to the present invention, it is possible to accurately recognize a stamp character existing in a form.

本発明の第1の実施形態の帳票認識装置の構成図である。It is a block diagram of the form recognition apparatus of the 1st Embodiment of this invention. 本発明の第1の実施形態の帳票認識装置による帳票認識処理を実行する各モジュールを説明するための図である。It is a figure for demonstrating each module which performs the form recognition process by the form recognition apparatus of the 1st Embodiment of this invention. 本発明の第1の実施形態の帳票画像データの説明図である。It is explanatory drawing of the form image data of the 1st Embodiment of this invention. 本発明の第1の実施形態の二値画像データの説明図である。It is explanatory drawing of the binary image data of the 1st Embodiment of this invention. 本発明の第1の実施形態の輪郭画像データの説明図である。It is explanatory drawing of the contour image data of the 1st Embodiment of this invention. 本発明の第1の実施形態の輪郭追跡処理の説明図である。It is explanatory drawing of the outline tracking process of the 1st Embodiment of this invention. 本発明の第1の実施形態の輪郭追跡処理で交点を算出するために選択された黒画素点の説明図である。It is explanatory drawing of the black pixel point selected in order to calculate an intersection by the outline tracking process of the 1st Embodiment of this invention. 本発明の第1の実施形態の丸印の輪郭の中心と半径とを算出する説明図である。It is explanatory drawing which calculates the center and radius of the outline of the round mark of the 1st Embodiment of this invention. 本発明の第1の実施形態の押印の日付区切り線の説明図である。It is explanatory drawing of the date separator line of the stamp of the 1st Embodiment of this invention. 本発明の第1の実施形態の文字列探索部によって抽出された文字列の説明図である。It is explanatory drawing of the character string extracted by the character string search part of the 1st Embodiment of this invention. 本発明の第1の実施形態の押印が傾き補正された状態の説明図である。It is explanatory drawing of the state by which the stamp of the 1st Embodiment of this invention was inclination-corrected. 本発明の第2の実施形態の帳票認識装置による帳票認識処理を実行する各モジュールを説明するための図である。It is a figure for demonstrating each module which performs the form recognition process by the form recognition apparatus of the 2nd Embodiment of this invention. 本発明の第2の実施形態の押印認識用辞書の説明図である。It is explanatory drawing of the dictionary for a stamp recognition of the 2nd Embodiment of this invention. 本発明の第2の実施形態の押印テンプレート生成部の押印テンプレート生成処理を実行するための各モジュールの説明図である。It is explanatory drawing of each module for performing the stamp template production | generation process of the stamp template production | generation part of the 2nd Embodiment of this invention. 従来の帳票認識処理の説明図である。It is explanatory drawing of the conventional form recognition process.

以下、本発明の実施形態を図1〜図14を用いて説明する。   Hereinafter, embodiments of the present invention will be described with reference to FIGS.

(第1の実施形態)
本発明の第1の実施形態を図1〜図11を用いて説明する。
(First embodiment)
A first embodiment of the present invention will be described with reference to FIGS.

本発明の帳票(又は押印)認識装置は、入力された帳票画像から押印を検出し、検出された押印に存在する文字を認識し、文字認識結果によって帳票を分類する。押印が存在する帳票には、例えば、領収印が押印された公共料金等の払込帳票等がある。帳票認識装置が領収印を認識した場合には、例えば、領収印中の日付を認識し、料金払込の延滞の有無等によって帳票を分類する。   The form (or stamp) recognition apparatus of the present invention detects a stamp from an input form image, recognizes a character existing in the detected stamp, and classifies the form according to a character recognition result. Examples of the form having a seal include a payment form such as a utility bill with a receipt stamp. When the form recognition apparatus recognizes the receipt, for example, the date in the receipt is recognized, and the form is classified based on whether or not the payment has been delayed.

図1は、本発明の第1の実施形態の帳票認識装置の構成図である。   FIG. 1 is a configuration diagram of a form recognition apparatus according to the first embodiment of the present invention.

帳票認識装置101は、入力装置102、表示装置103、イメージ取得装置104、通信装置105、演算装置106、及び外部記憶装置107を備える。   The form recognition device 101 includes an input device 102, a display device 103, an image acquisition device 104, a communication device 105, a calculation device 106, and an external storage device 107.

入力装置102は、演算装置106が実行するプログラムを制御するためのコマンド、及び、帳票認識装置101に接続される外部機器を制御するためのコマンド等を入力するための装置である。入力装置102は、例えば、キーボード又はマウス等である。   The input device 102 is a device for inputting a command for controlling a program executed by the arithmetic device 106, a command for controlling an external device connected to the form recognition device 101, and the like. The input device 102 is, for example, a keyboard or a mouse.

表示装置103は、処理内容等を適宜表示するディスプレイ等である。   The display device 103 is a display or the like that displays processing contents and the like as appropriate.

イメージ取得装置104は、スキャナ等のイメージ取得用の装置であり、帳票を光学的に走査することによって帳票画像を取得する。なお、取得した帳票画像等は、外部記憶装置107に記憶される。   The image acquisition device 104 is an image acquisition device such as a scanner, and acquires a form image by optically scanning the form. The acquired form image or the like is stored in the external storage device 107.

通信装置105は、帳票認識装置101に接続される外部機器(例えば、PCやサーバ等)とデータを通信する。通信装置105は、外部機器からユーザによって入力された実行コマンド、並びに画像及びテキスト等のデータを受信する。また、通信装置105は、帳票認識装置101での処理内容及び帳票認識装置101による帳票認識結果等を外部機器に送信する。   The communication device 105 communicates data with an external device (for example, a PC or a server) connected to the form recognition device 101. The communication device 105 receives an execution command and data such as an image and text input by a user from an external device. In addition, the communication device 105 transmits the processing content in the form recognition device 101, the form recognition result by the form recognition device 101, and the like to an external device.

演算装置106は、CPUであり、帳票を認識する帳票認識処理等を実行する演算装置である。   The arithmetic device 106 is a CPU, and is an arithmetic device that executes a form recognition process for recognizing a form.

外部記憶装置107は、HDD(Hard Disk Drive)及びメモリ等の外部記憶装置である。外部記憶装置107には、帳票画像、押印画像、及び押印認識用辞書等の各種データが記憶される。また、外部記憶装置107には、演算装置106によって実行される処理の途中で生成されるデータ等が一時的に記憶される。   The external storage device 107 is an external storage device such as an HDD (Hard Disk Drive) and a memory. The external storage device 107 stores various data such as a form image, a seal image, and a seal recognition dictionary. Further, the external storage device 107 temporarily stores data and the like generated during the processing executed by the arithmetic device 106.

帳票認識装置101は、演算装置106及び外部記憶装置107を少なくとも備えていればよく、入力装置102、表示装置103、イメージ取得装置104、及び通信装置105を備えなくてもよい。   The form recognition device 101 only needs to include at least the arithmetic device 106 and the external storage device 107, and may not include the input device 102, the display device 103, the image acquisition device 104, and the communication device 105.

帳票認識装置101が入力装置102を備えない場合には、外部機器から通信装置105を介して指示されると処理が開始されるようにするか、予め指令された時刻になると自動的に処理が開始されるようにする。   If the form recognition device 101 does not include the input device 102, the processing is started when an instruction is given from the external device via the communication device 105, or the processing is automatically performed at a pre-instructed time. To be started.

帳票認識装置101が表示装置103を備えない場合には、帳票認識装置101による処理結果は通信装置105を介して外部機器に送信されるようにするか、外部記憶装置107に記憶されるようにする。   When the form recognition device 101 does not include the display device 103, the processing result by the form recognition device 101 is transmitted to the external device via the communication device 105 or stored in the external storage device 107. To do.

ある処理を実行するモジュールが他の処理を実行するモジュールへ処理結果を入力する場合には、あるモジュールが外部記憶装置107を介して処理結果を介して他のモジュールへ入力するようにしてもよい。具体的には、処理部1が処理結果を処理部2に出力し、処理部2に処理部1の処理結果が入力される場合、処理部1が処理結果を外部記憶装置107に出力し、外部記憶装置107が処理結果を記憶し、処理部2は外部記憶装置107に記憶された処理部1の処理結果を入力として取得する。   When a module that executes a certain process inputs a processing result to a module that executes another process, the certain module may input the other module via the processing result via the external storage device 107. . Specifically, when the processing unit 1 outputs the processing result to the processing unit 2 and the processing result of the processing unit 1 is input to the processing unit 2, the processing unit 1 outputs the processing result to the external storage device 107, The external storage device 107 stores the processing result, and the processing unit 2 acquires the processing result of the processing unit 1 stored in the external storage device 107 as an input.

また、処理を実行するモジュールは、入力装置102を介してユーザによって適宜制御される。   Further, the module for executing the processing is appropriately controlled by the user via the input device 102.

図2は、本発明の第1の実施形態の帳票認識装置101による帳票認識処理を実行する各モジュールを説明するための図である。   FIG. 2 is a diagram illustrating each module that executes a form recognition process by the form recognition apparatus 101 according to the first embodiment of this invention.

帳票認識処理は、帳票に押印された押印領域の文字を認識する処理である。   The form recognition process is a process for recognizing characters in a stamped area stamped on a form.

帳票認識装置は、例えば、図3に示す帳票に押印の有無を検知し、押印が存在する場合には、押印中に書かれた文字(銀行名、日付等)を認識し、文字の認識結果によって帳票を分類したり、後に参照するために、認識結果とともに帳票イメージを記憶装置に保存しておくことである。例えば、領収印の日付を認識し、認識した日付と納付期限とを照合することで、延滞の有無を判断し、帳票を分類する目的に用いられる。   The form recognition device, for example, detects the presence or absence of a seal on the form shown in FIG. 3, and recognizes the characters (bank name, date, etc.) written in the seal when there is a seal, and results of character recognition In order to categorize the form according to or to refer to it later, the form image is stored in the storage device together with the recognition result. For example, it is used for the purpose of classifying a form by recognizing the date of the receipt and comparing the recognized date with the payment deadline to determine whether or not the payment is overdue.

帳票認識装置101は、帳票認識処理を実行するためのモジュールとして、イメージ入力部211、押印検出部212、背景色分離部213、傾き補正部214、文字列探索部216、文字切出部217、文字認識部218、知識処理部219、棄却判定部220、リトライ判定部221、認識結果記録部222、及び帳票分類部223を備え、知識処理部219が参照するデータベースとして知識処理用辞書202、及び認識結果記録部222が認識結果を記録するための認識結果DB203を備える。   The form recognition apparatus 101 includes, as modules for executing a form recognition process, an image input unit 211, a seal detection unit 212, a background color separation unit 213, an inclination correction unit 214, a character string search unit 216, a character cutout unit 217, A character recognition unit 218, a knowledge processing unit 219, a rejection determination unit 220, a retry determination unit 221, a recognition result recording unit 222, and a form classification unit 223, and a knowledge processing dictionary 202 as a database to be referred to by the knowledge processing unit 219; The recognition result recording unit 222 includes a recognition result DB 203 for recording the recognition result.

各モジュール及びデータベースについて説明する。   Each module and database will be described.

イメージ入力部211は、イメージ取得装置104によって帳票を光学的に走査することによって、帳票画像データを取得し、取得した帳票画像データを押印検出部212に出力する。ここでは、イメージ入力部211は図3に示す帳票画像データを取得したものとする。   The image input unit 211 acquires form image data by optically scanning the form with the image acquisition device 104, and outputs the acquired form image data to the seal detection unit 212. Here, it is assumed that the image input unit 211 has acquired the form image data shown in FIG.

図3は、本発明の第1の実施形態の帳票画像データの説明図である。   FIG. 3 is an explanatory diagram of the form image data according to the first embodiment of this invention.

図3に示すように、本実施形態の帳票認識装置101に取り込まれる帳票は税金の領収書であり、右下部に押印がなされている。   As shown in FIG. 3, the form taken into the form recognition apparatus 101 of the present embodiment is a tax receipt, and is stamped at the lower right.

図2に戻り、押印検出部212の説明をする。   Returning to FIG. 2, the seal detection unit 212 will be described.

押印検出部212は、イメージ入力部211から入力された帳票画像データ内に押印が存在するか否かを判定し、押印が存在する場合には、帳票画像データから押印領域を検出する。   The stamp detection unit 212 determines whether or not a stamp exists in the form image data input from the image input unit 211. If a stamp exists, the stamp detection unit 212 detects a stamp area from the form image data.

具体的には、押印検出部212は、押印が存在する場合には、画像二値化処理、輪郭抽出処理、輪郭追跡処理、及び中心座標・半径推定処理を実行して、押印の形状、及び押印のサイズ(押印が丸印である場合は、押印領域の中心座標及び半径、押印が四角印である場合は、押印領域の縦横の長さ等)等を推定し、押印の外輪郭部分を検出して、背景色分離部213に処理を移す。   Specifically, if there is a seal, the seal detection unit 212 performs an image binarization process, a contour extraction process, a contour tracking process, and a center coordinate / radius estimation process to obtain the shape of the seal, and Estimate the size of the stamp (when the stamp is a circle, the center coordinates and radius of the stamp area, and when the stamp is a square mark, the length and width of the stamp area, etc.) Then, the process proceeds to the background color separation unit 213.

一方、押印検出部212は、押印が存在しない場合には、帳票の認識結果を認識結果DB203に記録し、帳票を分類し、次に読み取るべき帳票がある場合には、イメージ入力部211に処理を移す。   On the other hand, if there is no seal, the seal detection unit 212 records the form recognition result in the recognition result DB 203, classifies the form, and if there is a form to be read next, the image input unit 211 performs processing. Move.

次に、
押印が存在すると判定された場合の押印検出部212の処理について説明する。
next,
A process of the seal detection unit 212 when it is determined that a seal exists will be described.

まず、画像二値化処理について説明する。   First, the image binarization process will be described.

押印検出部212は、画像二値化処理では、イメージ入力部211から入力された帳票画像データを構成する画素のうち、所定の輝度値以上の画素を黒画素に変換し、所定の輝度値よりも小さい画素を白画素に変換することによって、帳票画像データを白画素と黒画素とから構成される二値画像データに変換する。   In the image binarization process, the seal detection unit 212 converts pixels having a predetermined luminance value or more into black pixels among the pixels constituting the form image data input from the image input unit 211, and uses the predetermined luminance value. By converting the smaller pixels into white pixels, the form image data is converted into binary image data composed of white pixels and black pixels.

図3に示す帳票画像データに対して画像二値化処理が実行されることによって、図3に示す帳票画像データは、図4に示す二値画像データに変換される。   By performing the image binarization process on the form image data shown in FIG. 3, the form image data shown in FIG. 3 is converted into the binary image data shown in FIG.

図4は、本発明の第1の実施形態の二値画像データの説明図である。   FIG. 4 is an explanatory diagram of binary image data according to the first embodiment of this invention.

図4では、図3に示す帳票画像データを構成する画素のうち、所定の輝度値以上の画素が黒画素に変換され、所定の輝度値よりも小さい画素が白画素に変換されている。   In FIG. 4, among the pixels constituting the form image data shown in FIG. 3, pixels having a predetermined luminance value or more are converted into black pixels, and pixels smaller than the predetermined luminance value are converted into white pixels.

図2に戻り、押印検出部212の輪郭抽出処理について説明する。   Returning to FIG. 2, the contour extraction process of the seal detection unit 212 will be described.

押印検出部212は、輪郭抽出処理では、画像二値化処理によって変換された二値画像データの黒画素から構成される黒領域の輪郭を抽出して、輪郭画像データを生成する。押印検出部212は、例えば、白画素から構成される白領域と黒画素から構成される黒領域との境界部分の画素を黒画素に変換し、その他の画素を白画素に変換することによって、黒画素から構成される輪郭画像データを生成する。換言すると、押印検出部212は、二値画像データの黒画素のうち、白画素に隣接する黒画素を黒画素のままとし、白画素に隣接しない黒画素を白画素に変換することによって、輪郭画像データを生成する。   In the contour extraction process, the seal detection unit 212 extracts the contour of the black area composed of the black pixels of the binary image data converted by the image binarization process, and generates contour image data. The seal detection unit 212 converts, for example, a pixel at a boundary portion between a white region composed of white pixels and a black region composed of black pixels into a black pixel, and converts the other pixels into white pixels. Contour image data composed of black pixels is generated. In other words, the seal detection unit 212 keeps the black pixels adjacent to the white pixels out of the black pixels of the binary image data as black pixels, and converts the black pixels not adjacent to the white pixels into white pixels, thereby generating a contour. Generate image data.

図4に示す二値画像データに対して輪郭抽出処理が実行されることによって、図4に示す二値画像データから図5に示す輪郭画像データが生成される。   By performing the contour extraction process on the binary image data shown in FIG. 4, the contour image data shown in FIG. 5 is generated from the binary image data shown in FIG.

図5は、本発明の第1の実施形態の輪郭画像データの説明図である。   FIG. 5 is an explanatory diagram of contour image data according to the first embodiment of this invention.

図5では、図4に示す二値画像データのうち、白領域と黒領域との境界部分の画素が黒画素に変換され、その他の画素が白の画素に変換されている。   In FIG. 5, in the binary image data shown in FIG. 4, pixels at the boundary between the white area and the black area are converted into black pixels, and the other pixels are converted into white pixels.

なお、輪郭抽出処理では、輪郭の滑らかさに基づいて、直線及び円周以外を形成する輪郭以外を除去してもよい。   In the contour extraction process, other than the contour that forms other than the straight line and the circumference may be removed based on the smoothness of the contour.

図2に戻り、押印検出部212の輪郭追跡処理について説明する。   Returning to FIG. 2, the contour tracking process of the seal detection unit 212 will be described.

押印検出部212は、輪郭追跡処理では、輪郭を追跡して、輪郭が円周である場合には当該円の中心座標を推定する処理である。   In the contour tracking process, the seal detection unit 212 is a process of tracking the contour and estimating the center coordinates of the circle when the contour is a circumference.

輪郭追跡処理の詳細について図6を用いて説明する。   Details of the contour tracking process will be described with reference to FIG.

図6は、本発明の第1の実施形態の輪郭追跡処理の説明図である。   FIG. 6 is an explanatory diagram of the contour tracking process according to the first embodiment of this invention.

まず、押印検出部212は、輪郭抽出処理で変換された輪郭画像データの黒画素点から一つの黒画素点X1を選択し、選択された黒画素点X1に他の黒画素点によって接続されているもう一つの黒画素点X3を選択する。そして、押印検出部212は、黒画素点X1及びX3を接続する黒画素点から一つの黒画素点X2を選択する。   First, the seal detection unit 212 selects one black pixel point X1 from the black pixel points of the contour image data converted by the contour extraction process, and is connected to the selected black pixel point X1 by another black pixel point. Another black pixel point X3 is selected. Then, the seal detection unit 212 selects one black pixel point X2 from the black pixel points connecting the black pixel points X1 and X3.

次に、押印検出部212は、黒画素点X1と黒画素点X2とを接続する直線の垂直二等分線と、黒画素点X2と黒画素点X3とを接続する直線の垂直二等分線との交点Cを算出する。   Next, the seal detection unit 212 divides the straight vertical bisector connecting the black pixel point X1 and the black pixel point X2 and the vertical bisector of the straight line connecting the black pixel point X2 and the black pixel point X3. The intersection point C with the line is calculated.

ここで、交点Cが帳票内に存在しない場合には、黒画素点X1と黒画素点X3とを接続する線は直線であると判定する。一方、交点Cが帳票内に存在する場合、算出された交点Cの座標は、丸印の中心点の推定座標となる。   Here, when the intersection C does not exist in the form, it is determined that the line connecting the black pixel point X1 and the black pixel point X3 is a straight line. On the other hand, when the intersection C exists in the form, the calculated coordinates of the intersection C are estimated coordinates of the center point of the circle.

このようにして、輪郭追跡処理では、黒画素点X1、X2、及びX3からなるグループが輪郭画像データを構成する黒画素点からN(Nは自然数)個選択され、選択されたN個のグループのN個の交点C1、C2、…、CNが算出される。これらの交点C1、C2、…、CNの座標は、円の中心の推定座標となる。   Thus, in the contour tracking process, N (N is a natural number) groups of black pixel points X1, X2, and X3 are selected from the black pixel points constituting the contour image data, and the selected N groups. N intersection points C1, C2,..., CN are calculated. The coordinates of these intersections C1, C2,..., CN are estimated coordinates of the center of the circle.

図5に示す輪郭画像データに対して輪郭追跡処理が実行され、輪郭画像データからN個のグループを構成する黒画素点が選択された状態を図7に示す。   FIG. 7 shows a state in which the contour tracking process is executed on the contour image data shown in FIG. 5 and black pixel points constituting N groups are selected from the contour image data.

図7は、本発明の第1の実施形態の輪郭追跡処理で交点を算出するために選択された黒画素点の説明図である。   FIG. 7 is an explanatory diagram of black pixel points selected for calculating intersections in the contour tracking process according to the first embodiment of this invention.

図7では、輪郭追跡処理で選択された黒画素点は、十字によって示される。   In FIG. 7, the black pixel points selected in the contour tracking process are indicated by a cross.

図2に戻り、押印検出部212の中心座標・半径推定処理について説明する。   Returning to FIG. 2, the center coordinate / radius estimation processing of the seal detection unit 212 will be described.

押印検出部212は、中心座標・半径推定処理では、輪郭追跡処理で算出された交点C1、C2、…、CNを用いて、丸印の中心座標と丸印の半径を推定する。   In the center coordinate / radius estimation process, the seal detection unit 212 estimates the center coordinates of the circle and the radius of the circle using the intersections C1, C2,..., CN calculated in the contour tracking process.

具体的には、押印検出部212は、輪郭追跡処理で算出された交点C1、C2、…、CNのうち、互いに近接する位置に存在する交点の集合を選択し、選択された交点の集合の平均座標を円の中心座標とする。   Specifically, the seal detection unit 212 selects a set of intersections existing at positions close to each other from the intersections C1, C2,..., CN calculated by the contour tracking process, and sets the selected intersection set. The average coordinate is the center coordinate of the circle.

また、押印検出部212は、算出された中心座標から、選択された交点の集合を構成する交点の算出に用いた黒画素点の座標までの距離の平均値を円の半径とする。   Further, the seal detection unit 212 sets the average value of the distances from the calculated center coordinates to the coordinates of the black pixel points used to calculate the intersections constituting the selected intersection set as the radius of the circle.

そして、押印検出部212は、中心座標・半径推定処理で算出された半径が所定の値よりも大きければ、当該半径から丸印を押印として検出する。   If the radius calculated in the center coordinate / radius estimation process is larger than a predetermined value, the seal detection unit 212 detects a circle as a seal from the radius.

図8を用いて丸印の半径の算出方法について説明する。   A method for calculating the radius of the circle will be described with reference to FIG.

図8は、本発明の第1の実施形態の丸印の輪郭の中心と半径とを算出する説明図である。   FIG. 8 is an explanatory diagram for calculating the center and radius of the outline of the circle according to the first embodiment of this invention.

中心座標・半径処理で算出された中心座標を点Cとして示す。この点Cを算出するために用いた交点を算出に用いた黒画素点の座標をX1〜X25として示す。   The center coordinate calculated by the center coordinate / radius process is indicated as a point C. The coordinates of the black pixel points used to calculate the intersection used to calculate this point C are shown as X1 to X25.

押印検出部212は、点CからX1〜X25までの各距離を算出し、算出された距離の平均を丸印の半径として算出する。   The seal detection unit 212 calculates each distance from the point C to X1 to X25, and calculates the average of the calculated distance as the radius of the circle.

以上によって、押印検出部212は、押印を検出することでき、押印の中心座標、及び押印のサイズ(半径)を算出できる。なお、押印の中心座標及び押印のサイズから、押印の輪郭及び帳票内での押印の位置を特定できる。   As described above, the seal detection unit 212 can detect the seal and can calculate the center coordinates of the seal and the size (radius) of the seal. The outline of the stamp and the position of the stamp in the form can be specified from the center coordinates of the stamp and the size of the stamp.

図2に戻り、背景色分離部213について説明する。   Returning to FIG. 2, the background color separation unit 213 will be described.

背景色分離部213は、押印色とその他の色(背景色)を分離することによって、押印領域を抽出する。   The background color separation unit 213 extracts the seal area by separating the seal color from other colors (background colors).

具体的には、背景色分離部213は、押印検出部212によって算出された押印の中心座標及び押印の半径に基づいて、イメージ入力部211から入力された帳票画像データ内での押印の輪郭位置を特定する。そして、背景色分離部213は、特定された押印の輪郭位置付近の色のうち、ピーク色から色空間において所定範囲内に存在する色を押印色として選択する。ピーク色は、押印画像に対して、色空間(例えば、RGB、HCL等)のヒストグラムを算出し、当該ヒストグラムのピークを示す色をピーク色とする。   Specifically, the background color separation unit 213 determines the contour position of the stamp in the form image data input from the image input unit 211 based on the center coordinates of the stamp and the radius of the stamp calculated by the stamp detection unit 212. Is identified. Then, the background color separation unit 213 selects, as the stamp color, a color that exists within a predetermined range in the color space from the peak color among the colors near the contour position of the specified stamp. For the peak color, a histogram of a color space (for example, RGB, HCL, etc.) is calculated for the stamped image, and the color indicating the peak of the histogram is the peak color.

押印の輪郭位置付近は、押印の輪郭位置から所定の距離以内に存在する画素を示す。当該所定の距離をr1とし、押印の外接矩形の縦の長さをL1とし、横の長さをL2とし、押印の外接矩形の縦の長さ及び横の長さのうち長い方の長さをL(L=max{L1、L2})とし、kを予め定められた1より小さい正の実数とすると、当該所定の距離はr1=kLとして表現される。   The vicinity of the contour position of the stamp indicates a pixel existing within a predetermined distance from the contour position of the stamp. The predetermined distance is r1, the vertical length of the circumscribed rectangle of the stamp is L1, the horizontal length is L2, and the longer one of the vertical length and the horizontal length of the circumscribed rectangle of the stamp If L is L (L = max {L1, L2}), and k is a positive real number smaller than 1, the predetermined distance is expressed as r1 = kL.

例えば、押印が円である場合には、押印の輪郭位置から所定の距離以内に存在する画素の座標は、丸印の中心位置をcとし、丸印の半径をrとすると、r−r1<||z−c||<r+r1をとなる点zを座標に位置する画素となる。これによって、押印のサイズ(スケール)が違っていても、押印の輪郭位置から所定の距離以内に存在する画素を抽出できる。   For example, when the stamp is a circle, the coordinates of pixels existing within a predetermined distance from the contour position of the stamp are r−r1 <if the center position of the circle is c and the radius of the circle is r. This is a pixel located at the coordinates of the point z where || z−c || <r + r1. Thus, even if the size (scale) of the stamp is different, pixels existing within a predetermined distance from the contour position of the stamp can be extracted.

次に、押印色について説明する。   Next, the stamp color will be described.

押印の輪郭位置から所定の距離以内に存在する画素が有する色情報のピーク色をpとして、ピーク色pに対する色空間における距離が予め設定された所定範囲内になるような色xを押印色として抽出する。ここで、押印色xとピーク色pとの色空間における距離D(x、p)とし、予め設定された所定範囲を示す値をr2とすると、D(x、p)≦r2を満たすようなすべての色xが押印色として抽出される。色aと色bとの色空間における距離D(a、b)としては、例えば、RGB色空間上のユークリッド距離、及びHCL空間上のHCL色距離等を用いてもよい。   The peak color of the color information of pixels existing within a predetermined distance from the contour position of the stamp is set as p, and the color x such that the distance in the color space with respect to the peak color p is within a predetermined range is set as the stamp color. Extract. Here, when the distance D (x, p) in the color space between the stamp color x and the peak color p is set to r2, and a value indicating a predetermined range set in advance is set to r2, D (x, p) ≦ r2 is satisfied. All colors x are extracted as stamp colors. As the distance D (a, b) in the color space between the color a and the color b, for example, the Euclidean distance in the RGB color space, the HCL color distance in the HCL space, or the like may be used.

押印色xとして抽出されていない画素の色を背景色とすることによって、押印色の画素を押印部とし、背景色の画素を背景部とし、押印色と背景色とが分離される。これによって、帳票に存在する押印が帳票のプレ印刷と重複していても、押印部を正確に検出できるようになる。   By setting the pixel color not extracted as the stamp color x as the background color, the stamp color pixel is used as the stamp portion, the background color pixel is used as the background portion, and the stamp color and the background color are separated. This makes it possible to accurately detect the stamped portion even if the stamp existing in the form overlaps with the pre-printing of the form.

次に、傾き補正部214について説明する。   Next, the inclination correction unit 214 will be described.

傾き補正部214は、背景色分離部213によって押印色が背景色と分離された押印画像の押印の傾きを補正する。   The inclination correction unit 214 corrects the inclination of the stamp of the stamp image in which the stamp color is separated from the background color by the background color separation unit 213.

以下に、傾き補正部214による押印の傾き補正処理について説明する。   Hereinafter, the inclination correction process of the stamp by the inclination correction unit 214 will be described.

傾き補正部214は、押印中に存在する線分(図9に示す日付区切り線)を利用して押印の傾きを検出する。具体的には、傾き補正部214は、押印検出部212によって検出された押印の輪郭よりも内側(例えば、中心がc、半径がrの円の場合には、||z−c||<rとなるすべての画素z)に存在する線分を検出し、傾き補正部214に設定されたx軸を基準として検出した線分の傾きを算出する。そして、傾き補正部214は算出された線分がx軸に一致するように、押印部全体を回転させることによって、押印の傾きを補正する。また、帳票内に存在する線分からx軸に対する傾き最も小さい線分を検出して、検出した線分を押印の傾き基準となる線分として利用してもよい。   The inclination correction unit 214 detects the inclination of the stamp using a line segment (date separator line shown in FIG. 9) existing during the stamp. Specifically, the inclination correction unit 214 is located inside the outline of the seal detected by the seal detection unit 212 (for example, || z−c || <in the case of a circle whose center is c and radius is r). A line segment existing in all the pixels z) to be r is detected, and the inclination of the detected line segment is calculated with the x axis set in the inclination correction unit 214 as a reference. The inclination correcting unit 214 corrects the inclination of the stamp by rotating the entire stamping part so that the calculated line segment matches the x axis. Alternatively, a line segment having the smallest inclination with respect to the x-axis may be detected from line segments existing in the form, and the detected line segment may be used as a line segment serving as a reference for the inclination of the stamp.

また、押印中に複数の線分(日付区切り線)が存在する場合には、傾き補正部214は、まず、任意の一つの線分を選択し、選択された線分に基づいて押印部の傾きを補正する。そして、後述する棄却判定部220によって文字認識が棄却された場合には、リトライ判定部221が、傾き補正部214が未だ選択されていない他の線分を選択し、選択された線分に基づいて押印の傾きを補正するようにしてもよい。   In addition, when there are a plurality of line segments (date separator lines) in the seal, the inclination correction unit 214 first selects an arbitrary line segment, and based on the selected line segment, Correct the tilt. When the character recognition is rejected by the rejection determination unit 220 described later, the retry determination unit 221 selects another line segment that has not yet been selected by the inclination correction unit 214, and based on the selected line segment. The inclination of the stamp may be corrected.

なお、傾き補正部214は、押印検出部212の輪郭追跡処理で用いた輪郭追跡方法を用いてもよい。   Note that the inclination correction unit 214 may use the contour tracking method used in the contour tracking process of the seal detection unit 212.

図9は、本発明の第1の実施形態の押印の日付区切り線の説明図である。   FIG. 9 is an explanatory diagram of a date separator line for stamping according to the first embodiment of this invention.

図9に示すように、日付を示す文字列「20.5.31」の上側には第1日付区切り線901が存在し、下側には第2日付区切り線902が存在している。   As shown in FIG. 9, the first date separator 901 exists above the character string “20.5.31” indicating the date, and the second date separator 902 exists below the character string “20.5.31”.

以上のように、押印中に存在する線分から押印の傾きを検出して、当該傾きをある基準線に一致させるように補正するので、帳票に傾いた押印がされていても、当該傾きを補正して押印部を抽出することができる。このため、押印中の文字認識を正確に行うことができる。さらに、押印中の線分を用いて傾きを検出するため、罫線をある方向に射影したヒストグラムを用いて傾き補正する特許文献2及び3に記載された発明よりも、処理時間を短縮できる。   As described above, the inclination of the stamp is detected from the line segment existing in the stamp, and the inclination is corrected so that it matches the reference line, so that the inclination is corrected even if the stamp is inclined on the form. Thus, the stamped portion can be extracted. For this reason, the character recognition during a stamp can be performed correctly. Furthermore, since the inclination is detected using the line segment being stamped, the processing time can be shortened compared to the inventions described in Patent Documents 2 and 3 in which the inclination is corrected using a histogram in which ruled lines are projected in a certain direction.

図2に戻り、文字列探索部216について説明する。   Returning to FIG. 2, the character string search unit 216 will be described.

文字列探索部216は、傾き補正部214によって傾きが補正された押印から、第1日付区切り線901、第2日付区切り線902、及び押印の輪郭に基づいて、文字が存在する領域である文字領域を特定し、特定された文字領域から文字列を探索し、探索された文字列を抽出する。ここでは、図10に示す文字列が抽出されたものとする。   The character string search unit 216 is a character that is an area where characters exist based on the first date separator line 901, the second date separator line 902, and the outline of the seal from the stamp whose inclination is corrected by the inclination correction unit 214. An area is specified, a character string is searched from the specified character area, and the searched character string is extracted. Here, it is assumed that the character string shown in FIG. 10 has been extracted.

図10は、本発明の第1の実施形態の文字列探索部216によって抽出された文字列の説明図である。   FIG. 10 is an explanatory diagram of a character string extracted by the character string search unit 216 according to the first embodiment of this invention.

文字列探索部216によって、「20.5.31」からなる文字列が抽出される。ここで、「2」の文字は斜線とともに抽出されている。これは、図3に示す帳票画像データで押印とプレ印刷とが重なっていることに起因している。   The character string search unit 216 extracts a character string consisting of “20.5.31”. Here, the character “2” is extracted together with diagonal lines. This is due to the fact that the stamp and pre-printing overlap in the form image data shown in FIG.

図2に戻り、文字切出部217について説明する。文字列探索部216によって抽出された文字列から各文字を切り出す。   Returning to FIG. 2, the character cutout unit 217 will be described. Each character is cut out from the character string extracted by the character string search unit 216.

具体的には、文字切出部217は、例えば、黒画素と黒画素とを連結する成分を算出し、算出された成分を文字として切り出す。   Specifically, the character cutout unit 217 calculates, for example, a component that connects a black pixel and a black pixel, and cuts out the calculated component as a character.

なお、押印に存在する文字は、押印時のインクの滲みが原因で、別々の文字が連結してしまう場合もある。このため、文字切出部217は、黒画素と黒画素とを連結する成分の輪郭の滑らかさを用いて連結成分を分離することによって、インクの滲み等が原因で連結してしまった複数の文字を異なる文字として切り出してもよい。   Note that characters existing in the seal may be connected to each other due to ink bleeding at the time of the seal. For this reason, the character cutout unit 217 separates the connected components using the smoothness of the contours of the components that connect the black pixels and the black pixels, thereby connecting a plurality of components that are connected due to ink bleeding or the like. You may cut out a character as a different character.

文字認識部218は、文字切出部217によって切り出された個々の文字を認識し、文字列探索部216によって抽出された文字列を構成するすべての文字を認識した結果である複数の文字認識結果を算出する。   The character recognition unit 218 recognizes individual characters cut out by the character cutout unit 217, and recognizes all characters constituting the character string extracted by the character string search unit 216. Is calculated.

なお、単一文字の認識方法には様々な公知の方法が存在し、これらの認識方法から文字認識部218で用いる認識方法を選択して、選択した認識方法を用いることができる。   Note that there are various known methods for recognizing a single character. A recognition method used by the character recognition unit 218 can be selected from these recognition methods, and the selected recognition method can be used.

さらに、文字認識部218は、認識した個々の文字に対する信頼度を算出する。   Furthermore, the character recognition unit 218 calculates the reliability for each recognized character.

知識処理部219は、文字認識部218によって算出された複数の文字認識結果のうち、帳票認識装置101に予め設定された辞書に登録された形式に合致する文字認識結果を選択する。なお、帳票認識装置101に予め設定された辞書とは、図2に示す知識処理用辞書202に記録されている辞書である。   The knowledge processing unit 219 selects a character recognition result that matches a format registered in a dictionary preset in the form recognition device 101 from among a plurality of character recognition results calculated by the character recognition unit 218. The dictionary set in advance in the form recognition apparatus 101 is a dictionary recorded in the knowledge processing dictionary 202 shown in FIG.

棄却判定部220は、知識処理部219によって選択された各文字認識結果に対して信頼度を算出し、算出された信頼度に基づいて知識処理部219によって選択された文字認識結果を棄却するか否かを判定する。   Rejection determination unit 220 calculates the reliability for each character recognition result selected by knowledge processing unit 219, and rejects the character recognition result selected by knowledge processing unit 219 based on the calculated reliability. Determine whether or not.

各文字認識結果に対して信頼度を算出する処理について説明する。   A process for calculating the reliability for each character recognition result will be described.

例えば、知識処理部219によって選択された文字認識結果のL個の文字を含む文字列を構成する個々の文字の認識結果の信頼度がX1、X2、…、XLである場合に、棄却判定部220は、当該文字認識結果の信頼度(X)をX=(X1+…+XL)/Lによって算出する。   For example, when the reliability of the recognition result of each character constituting the character string including the L characters of the character recognition result selected by the knowledge processing unit 219 is X1, X2,. In 220, the reliability (X) of the character recognition result is calculated by X = (X1 +... + XL) / L.

そして、棄却判定部220は、当該文字認識結果の信頼度が予め設定された閾値よりも小さい場合には、当該文字認識結果の信頼度が低いと判断し、当該一の文字認識結果を棄却する。   Then, rejection determination unit 220 determines that the reliability of the character recognition result is low when the reliability of the character recognition result is smaller than a preset threshold, and rejects the one character recognition result. .

また、棄却判定部220は、各文字の認識結果の信頼度に対して重み付けをして、文字認識結果の信頼度を算出してもよい。   Rejection determination unit 220 may calculate the reliability of the character recognition result by weighting the reliability of the recognition result of each character.

具体的には、棄却判定部220は、L個の個々の文字の認識結果の重みをa1、a2、…、aL(a1+…+aL=1)とし、一の文字認識結果の信頼度(X)をX=(a1・X1+…+aL・XL)/Lとしてもよい。   Specifically, rejection determination section 220 sets the recognition result weights of L individual characters as a1, a2,..., AL (a1 +... + AL = 1), and the reliability (X) of one character recognition result. X = (a1 · X1 +... + AL · XL) / L.

例えば、棄却判定部220は、知識処理部219によって選択された文字認識結果が年月日を示す文字列を示す場合には、「日」に対応する文字、「月」に対応する文字、及び「年」に対応する文字の順に重みが小さくなるようにしてもよい。つまり、「年」に対応する文字の信頼度の重み付けを最も低くし、次いで「月」に対応する文字の信頼度の重み付けを低くし、「日」に対応する文字の信頼度の重み付けを最も高くする。これによって、ユーザにとって重要となる文字の認識に高い信頼度を要求するように設計できる。   For example, when the character recognition result selected by the knowledge processing unit 219 indicates a character string indicating a date, the rejection determination unit 220 indicates a character corresponding to “day”, a character corresponding to “month”, and The weight may be decreased in the order of the characters corresponding to “year”. In other words, the reliability weight of the character corresponding to “Year” is set to the lowest, then the reliability weight of the character corresponding to “Month” is set to the lowest, and the reliability weight of the character corresponding to “Day” is set to the lowest. Make it high. As a result, it is possible to design so as to require a high degree of reliability for character recognition that is important to the user.

以上によって、棄却判定部220は、信頼度が閾値よりも小さい文字認識結果を棄却するため、例えば、かすれによって押印中の日付欄のピリオドが消失した場合、及び、かすれにより数字の一部が欠けた場合の文字認識結果の信頼度は通常の文字認識結果よりも低くなるため、このような場合の文字認識結果を棄却することができる。これによって、帳票認識装置101の文字の誤認識を防止することができる。   As described above, the rejection determination unit 220 rejects the character recognition result whose reliability is smaller than the threshold value. For example, when the period in the date column being stamped disappears due to blurring, and some of the numbers are missing due to blurring. Since the reliability of the character recognition result in this case is lower than the normal character recognition result, the character recognition result in such a case can be rejected. Thereby, erroneous recognition of characters in the form recognition apparatus 101 can be prevented.

リトライ判定部221は、再度文字列探索部216まで処理を移行させ、文字認識を再度実行(リトライ)するか、処理を終了するかを判定する。リトライ判定部221は、例えば、知識処理部219によって選択されたすべての文字認識結果が棄却判定部220によって棄却された場合に、リトライすると判定する。   The retry determination unit 221 shifts the process to the character string search unit 216 again, and determines whether to perform character recognition again (retry) or to end the process. For example, the retry determination unit 221 determines to retry when all the character recognition results selected by the knowledge processing unit 219 are rejected by the rejection determination unit 220.

リトライ判定部221によってリトライすると判定された場合には、リトライ判定部221が、押印の傾きを再度補正する場合がある。   If the retry determination unit 221 determines to retry, the retry determination unit 221 may correct the inclination of the seal again.

具体的には、押印に複数の線分(日付区切り線)が存在する場合、及び押印が反転している場合等である。押印に複数の線分が存在する場合のリトライ判定部221の処理については、傾き補正部214で説明したので、説明を省略する。   Specifically, there are a case where a plurality of line segments (date separator lines) exist in the seal, and a case where the seal is reversed. Since the processing of the retry determination unit 221 when there are a plurality of line segments in the seal has been described in the tilt correction unit 214, description thereof will be omitted.

押印が反転している場合のリトライ判定部221の処理について説明する。   Processing of the retry determination unit 221 when the stamp is reversed will be described.

傾き補正部214によって押印の傾きが補正されても、補正後の押印が図11に示すように傾き補正後の押印が反転している場合がある。図11は、本発明の第1の実施形態の押印が傾き補正された状態の説明図である。リトライ判定部221は、当該傾き補正後の押印を180度回転させてから、文字列探索部216へ処理を移行する。   Even if the inclination of the stamp is corrected by the inclination correction unit 214, the corrected stamp may be reversed as shown in FIG. FIG. 11 is an explanatory diagram showing a state in which the stamp of the first embodiment of the present invention is tilt-corrected. The retry determination unit 221 moves the process to the character string search unit 216 after rotating the stamp after the inclination correction by 180 degrees.

押印が反転しているか否かの判定については、リトライ判定部221は、例えば、知識処理部219によって選択された文字認識結果の信頼度の平均値が予め設定された閾値よりも小さい場合に、押印が反転していると判定する。   Regarding the determination of whether or not the stamp is reversed, the retry determination unit 221, for example, when the average value of the reliability of the character recognition result selected by the knowledge processing unit 219 is smaller than a preset threshold value, It is determined that the stamp is reversed.

認識結果記録部222は、知識処理部219によって選択された文字認識結果が棄却された場合であっても、棄却されなかった場合であっても、当該文字認識結果を含む帳票の認識結果を認識結果データベース(DB)203へ記録する。   The recognition result recording unit 222 recognizes the recognition result of the form including the character recognition result regardless of whether the character recognition result selected by the knowledge processing unit 219 is rejected or not. Record in the result database (DB) 203.

認識結果DB203に記録される帳票の認識結果には、帳票画像データ、押印画像データ、傾き補正後の押印画像データ、及び押印情報等を含む情報が含まれてもよい。押印情報は、押印形状(押印輪郭)、押印サイズ、押印中の文字列位置及び文字列情報、文字列中の文字位置、文字の大きさ、並びに押印色等を含む。   The form recognition result recorded in the recognition result DB 203 may include form image data, stamp image data, stamp image data after skew correction, and information including stamp information. The stamp information includes a stamp shape (a stamp contour), a stamp size, a character string position and character string information in the stamp, a character position in the character string, a character size, a stamp color, and the like.

なお、認識結果DB203に登録された情報は、押印中の文字列情報(銀行名、及び日付等)をキーにした検索に用いられてもよい。   The information registered in the recognition result DB 203 may be used for a search using character string information (bank name, date, etc.) being stamped as a key.

帳票分類部223は、押印中の文字認識の結果に基づいて、帳票を分類する。例えば、帳票分類部223は、銀行名ごとに分類してもよいし、また、押印が領収印である場合には、支払い期限当日以前に押印された帳票と支払い期限翌日以降に押印された帳票とで分類してもよい。   The form classification unit 223 classifies the form based on the result of character recognition during stamping. For example, the form classification unit 223 may classify by bank name, and if the seal is a receipt, the form stamped before the payment due date and the form stamped after the payment deadline You may classify by.

以上のように、本実施形態の帳票認識装置101は、背景色分離部213を備えるので、押印色と背景色とを分離し、押印色近傍の色を有する画素を押印部の輪郭として抽出するため、押印がプレ印刷等と重なっていても、押印部の輪郭を正確に抽出できる。   As described above, the form recognition apparatus 101 according to the present embodiment includes the background color separation unit 213, and thus separates the stamp color and the background color, and extracts a pixel having a color near the stamp color as the contour of the stamp unit. Therefore, even if the stamp overlaps with pre-printing or the like, the contour of the stamp portion can be accurately extracted.

また、本実施形態の帳票認識装置101は、傾き補正部214を備えるので、押印が傾いている場合には、当該押印の傾き補正してから押印中の文字を認識するため、押印が傾いている場合であっても、押印中の文字を正確に認識できる。   In addition, since the form recognition apparatus 101 of the present embodiment includes the tilt correction unit 214, when the stamp is tilted, the stamp is tilted in order to recognize the character being stamped after correcting the tilt of the stamp. Even if it is, it is possible to accurately recognize the character being stamped.

また、本実施形態の傾き補正部214は、押印の傾き補正に押印中の線分(日付区切り線)を用いるため、罫線をある方向に射影したヒストグラムを用いて傾き補正する特許文献2及び3に記載された発明よりも、処理時間を短縮できる。さらに、本実施形態は、日付区切り線は輪郭追跡処理によって抽出されるので、日付区切り線がプレ印刷と重なっている場合であっても、日付区切り線がかすれている場合であっても、日付区切り線を正確に抽出できる。   In addition, since the inclination correction unit 214 of the present embodiment uses a line segment (date separator line) being stamped for correction of the inclination of the seal, Patent Documents 2 and 3 perform slope correction using a histogram in which ruled lines are projected in a certain direction. The processing time can be shortened as compared with the invention described in. Further, in the present embodiment, since the date separator line is extracted by the contour tracking process, even if the date separator line overlaps with the pre-printing or the date separator line is blurred, the date The separator line can be extracted accurately.

また、本実施形態の帳票認識装置101は、棄却判定部220を備えるので、文字認識がなされた文字列の信頼度が所定の閾値よりも小さい場合には、当該文字列を棄却するので、帳票認識装置101の文字の誤認識を防止できる。   In addition, since the form recognition apparatus 101 of the present embodiment includes the rejection determination unit 220, when the reliability of the character string that has been recognized is smaller than a predetermined threshold, the character string is rejected. It is possible to prevent erroneous recognition of characters in the recognition apparatus 101.

さらに、棄却判定部220は、文字認識がなされた文字列の信頼度を各文字に重み付けをして算出する場合に、「年」に対応する文字の信頼度の重み付けを最も低くし、次いで「月」に対応する文字の信頼度の重み付けを低くし、「日」に対応する文字の信頼度の重み付けを最も高くする。これによって、帳票認識装置101の認識対象となる帳票に、押印の年が異なる帳票が混在するケースはまれであるため、「月」及び「日」の文字認識の信頼度を、「年」の文字認識の信頼度よりも高くすることによって、帳票認識装置101が「月」及び「日」の文字を誤って認識してしまうことを防止できる。   Further, the rejection determination unit 220, when calculating the reliability of the character string that has been recognized by weighting each character, sets the weight of the reliability of the character corresponding to “year” to the lowest, The weight of the reliability of the character corresponding to “month” is lowered, and the weight of the reliability of the character corresponding to “day” is made highest. As a result, since it is rare for a form to be recognized by the form recognition apparatus 101 to have a form with different stamp years, the reliability of character recognition for “month” and “day” is set to “year”. By making the reliability higher than the character recognition reliability, it is possible to prevent the form recognition apparatus 101 from erroneously recognizing the characters “month” and “day”.

(第2の実施形態)
次に、本発明の第2の実施形態を図12〜図14を用いて説明する。
(Second Embodiment)
Next, a second embodiment of the present invention will be described with reference to FIGS.

本発明の第2の実施形態の帳票認識装置101は、図13に示す押印認識用辞書301を参照して帳票に存在する押印の種別を特定し、押印認識用辞書301に登録された押印の種別に対応する情報を参照して、帳票に存在する押印の文字を認識する。   The form recognition apparatus 101 according to the second embodiment of the present invention refers to the seal recognition dictionary 301 shown in FIG. 13 to identify the type of the seal existing in the form, and stores the seal registered in the seal recognition dictionary 301. By referring to the information corresponding to the type, the character of the seal present in the form is recognized.

これによって、押印中の文字列、文字列の意味(日付、及び銀行名等)、文字列の位置、文字の位置、及び文字大きさは、押印種ごとに決まっているため、押印の種別を特定することによって、文字の位置が決まり、文字列探索部316及び文字切出部317がこれらの情報を用いることによって、文字を誤って切り出すること、及び文字を誤って認識することを低減できる。   As a result, the character string being stamped, the meaning of the character string (date, bank name, etc.), the character string position, the character position, and the character size are determined for each stamp type. By specifying, the position of the character is determined, and the character string search unit 316 and the character cutout unit 317 can use these pieces of information to reduce the cutout of the character and the recognition of the character by mistake. .

本発明の第2実施形態の帳票認識装置101によって実行される処理は、帳票に存在する押印を認識する認識フェーズ(帳票認識処理)と、押印を認識するために参照する押印認識用辞書301を生成する学習フェーズ(押印認識用辞書生成処理)とによって構成される。   The process executed by the form recognition apparatus 101 according to the second embodiment of the present invention includes a recognition phase (form recognition process) for recognizing a seal existing in a form, and a seal recognition dictionary 301 that is referred to for recognizing the seal. And a learning phase (dictionary generation processing for stamp recognition) to be generated.

認識フェーズでは、帳票認識装置101は、帳票に存在する押印を次々と認識し、押印に基づいて帳票を分類する。帳票認識装置101は、認識フェーズで、押印認識用辞書301を参照する場合もある。学習フェーズでは、帳票認識装置101は、認識結果DB203に記録された認識結果、又はユーザによって入力された定義に基づいて、押印認識用辞書301を生成する。   In the recognition phase, the form recognition apparatus 101 recognizes the seals existing in the form one after another and classifies the forms based on the seals. The form recognition apparatus 101 may refer to the stamp recognition dictionary 301 in the recognition phase. In the learning phase, the form recognition apparatus 101 generates the stamp recognition dictionary 301 based on the recognition result recorded in the recognition result DB 203 or the definition input by the user.

認識フェーズを実行するためのモジュール及びデータベースを図12に示し、学習フェーズを実行するためのモジュール及びデータベースを図14に示す。   FIG. 12 shows a module and a database for executing the recognition phase, and FIG. 14 shows a module and a database for executing the learning phase.

本実施形態では、認識フェーズの処理を実行する装置(認識装置)と学習フェーズの処理を実行する装置(押印認識用辞書生成装置)とは帳票認識装置101によって実行されるものとするが、別々の装置によって実行されてもよい。認識フェーズの処理と学習フェーズの処理とが別々の装置によって実行される場合、認識フェーズの処理を実行する認識装置は図12に示すモジュールを備え、押印認識用辞書生成装置によって生成された押印認識用辞書を用いて、入力帳票に存在する押印を認識する。学習フェーズの処理を実行する押印認識用辞書生成装置は図14に示すモジュールを備え、認識結果DB203に記録されている認識結果、及びユーザによって入力された定義に基づいて、押印認識用辞書301を生成する。各モジュールの処理は、演算装置106によって実行される。   In the present embodiment, the device that executes the processing in the recognition phase (recognition device) and the device that executes the processing in the learning phase (dictionary generation device for stamp recognition) are executed by the form recognition device 101. May be executed by the apparatus. When the recognition phase processing and the learning phase processing are executed by different devices, the recognition device that executes the recognition phase processing includes the module shown in FIG. 12, and the stamp recognition generated by the stamp recognition dictionary generation device. Recognize the seals present in the input form using the dictionary. The stamp recognition dictionary generating apparatus that executes the learning phase processing includes the module shown in FIG. 14, and creates the seal recognition dictionary 301 based on the recognition result recorded in the recognition result DB 203 and the definition input by the user. Generate. The processing of each module is executed by the arithmetic device 106.

図12は、本発明の第2の実施形態の帳票認識装置101による帳票認識処理を実行する各モジュールを説明するための図である。図12に示すモジュールのうち本発明の第1の実施形態と同じモジュールは同じ番号を付与し、説明を省略する。   FIG. 12 is a diagram illustrating each module that executes a form recognition process by the form recognition apparatus 101 according to the second embodiment of this invention. Of the modules shown in FIG. 12, the same modules as those in the first embodiment of the present invention are given the same numbers, and the description thereof is omitted.

本実施形態の帳票認識装置101は、イメージ入力部211、押印検出部212、背景色分離部213、傾き補正部214、辞書利用判定部315、文字列探索部316、文字切出部317、文字認識部318、知識処理部319、棄却判定部320、リトライ判定部321、認識結果記録部222、帳票分類部223、押印種特定部331、及び押印劣化判定部332を備え、知識処理部219が参照するデータベースとして知識処理用辞書202、認識結果記録部222が認識結果を記録するための認識結果DB203、及び押印種特定部331が参照するデータベースとして押印認識用辞書301を備える。   The form recognition apparatus 101 of the present embodiment includes an image input unit 211, a seal detection unit 212, a background color separation unit 213, an inclination correction unit 214, a dictionary use determination unit 315, a character string search unit 316, a character cutout unit 317, a character A recognition unit 318, a knowledge processing unit 319, a rejection determination unit 320, a retry determination unit 321, a recognition result recording unit 222, a form classification unit 223, a stamp type identification unit 331, and a stamp deterioration determination unit 332, and the knowledge processing unit 219 As a database to be referred to, a knowledge processing dictionary 202, a recognition result DB 203 for the recognition result recording unit 222 to record a recognition result, and a stamp recognition dictionary 301 as a database to be referred to by the stamp type identification unit 331 are provided.

各モジュール及び各データベースについて説明する。なお、図12に示すモジュール及びデータベースのうち本発明の第1の実施形態と同じモジュール及びデータベースは同じ番号を付与し、説明を省略する。   Each module and each database will be described. Of the modules and databases shown in FIG. 12, the same modules and databases as those in the first embodiment of the present invention are assigned the same numbers, and descriptions thereof are omitted.

辞書利用判定部315は、押印認識用辞書301を用いて文字を認識するか否かを判定する。辞書利用判定部315によって押印認識用辞書301を用いて文字を認識すると判定された場合には、押印種特定部331に処理を移行する。辞書利用判定部315によって押印認識用辞書301を用いて文字を認識すると判定された場合には、文字列探索部316に処理を移行する。なお、押印認識用辞書301は、図13で詳細を説明する。   The dictionary usage determination unit 315 determines whether or not to recognize a character using the stamp recognition dictionary 301. If the dictionary use determination unit 315 determines that the character is to be recognized using the seal recognition dictionary 301, the process proceeds to the seal type identification unit 331. If the dictionary use determination unit 315 determines that the character is to be recognized using the seal recognition dictionary 301, the process proceeds to the character string search unit 316. The details of the stamp recognition dictionary 301 will be described with reference to FIG.

辞書利用判定部315の判定処理は、例えば、帳票認識装置101が導入されてから帳票認識処理が所定回数実行されるまで、押印認識用辞書を用いないで文字を認識すると判定し、帳票認識処理が所定回数実行されると押印認識用辞書を用いて文字を認識すると判定してもよい。これによって、押印認識用辞書301に登録された押印情報が所定数になると、押印認識用辞書301を用いて文字を認識するので、押印に存在する文字列の文字を正確に認識できる。   The determination process of the dictionary use determination unit 315 determines, for example, that a character is recognized without using the stamp recognition dictionary until the form recognition process is executed a predetermined number of times after the form recognition apparatus 101 is introduced. May be determined to be recognized using the stamp recognition dictionary. As a result, when the number of stamp information registered in the stamp recognition dictionary 301 reaches a predetermined number, the characters are recognized using the stamp recognition dictionary 301, so that the characters of the character string existing in the stamp can be accurately recognized.

また、辞書利用判定部315の判定処理は、一回目の文字認識は押印認識用辞書301を用いないで文字を認識すると判定し、文字認識が二回目以降となった場合、つまりリトライ判定部321によって再度文字を認識すると判定された場合には、押印認識用辞書301を用いて文字を認識すると判定するようにしてもよい。   The determination process of the dictionary use determination unit 315 determines that the first character recognition recognizes the character without using the stamp recognition dictionary 301, and the character recognition is performed for the second time or later, that is, the retry determination unit 321. If it is determined that the character is to be recognized again, the stamp recognition dictionary 301 may be used to determine that the character is to be recognized.

辞書利用判定部315によって押印認識用辞書301を用いないで文字を認識すると判定された場合の文字列探索部316の処理は、第1の実施形態の文字列探索部216の処理と同じであるので、説明を省略する。   The processing of the character string search unit 316 when the dictionary use determination unit 315 determines that the character is recognized without using the seal recognition dictionary 301 is the same as the processing of the character string search unit 216 of the first embodiment. Therefore, explanation is omitted.

辞書利用判定部315によって押印認識用辞書301を用いて文字を認識すると判定された場合には、文字列探索部316は、押印認識用辞書301に登録された押印情報のうち押印種特定部331によって特定された押印種別の押印文字列位置1305(図13参照)に登録された座標を参照して、帳票に存在する文字列を抽出する。   When the dictionary use determination unit 315 determines that the character is to be recognized using the seal recognition dictionary 301, the character string search unit 316 includes the stamp type identification unit 331 among the stamp information registered in the seal recognition dictionary 301. The character string existing in the form is extracted with reference to the coordinates registered at the stamped character string position 1305 (see FIG. 13) of the stamp type specified by.

辞書利用判定部315によって押印認識用辞書301を用いないで文字を認識すると判定された場合の文字切出部317の処理は、第1の実施形態の文字切出部217の処理と同じであるので、説明を省略する。   The processing of the character extraction unit 317 when the dictionary usage determination unit 315 determines that the character is recognized without using the seal recognition dictionary 301 is the same as the processing of the character extraction unit 217 of the first embodiment. Therefore, explanation is omitted.

辞書利用判定部315によって押印認識用辞書301を用いて文字を認識すると判定された場合には、文字切出部317は、押印認識用辞書301に登録された押印情報のうち押印種特定部331によって特定された押印種別の個々の文字位置1307(図13参照)に登録された座標を参照して、文字を切り出す。   When the dictionary use determination unit 315 determines that the character is to be recognized using the seal recognition dictionary 301, the character cutout unit 317 includes the seal type identification unit 331 among the stamp information registered in the seal recognition dictionary 301. The character is cut out with reference to the coordinates registered at the individual character position 1307 (see FIG. 13) of the stamp type specified by.

辞書利用判定部315によって押印認識用辞書301を用いないで文字を認識すると判定された場合の文字認識部318の処理は、第1の実施形態の文字認識部218の処理と同じであるので、説明を省略する。   The processing of the character recognition unit 318 when the dictionary use determination unit 315 determines that the character is recognized without using the seal recognition dictionary 301 is the same as the processing of the character recognition unit 218 of the first embodiment. Description is omitted.

辞書利用判定部315によって押印認識用辞書301を用いて文字を認識すると判定された場合には、文字認識部318は、押印劣化判定部332によって算出された押印の劣化度(かすれ度及びつぶれ度)に応じて、文字認識処理方法を切り替える。   When the dictionary use determining unit 315 determines that the character is to be recognized using the seal recognition dictionary 301, the character recognizing unit 318 determines the degree of deterioration of the stamp (the blurring degree and the crushing degree) calculated by the stamp deterioration determining unit 332. ) To switch the character recognition processing method.

文字認識部318は、例えば、押印のかすれ度が大きい場合には、かすれ文字を学習した文字認識方法を用いて文字を認識し、押印のつぶれ度が大きい場合には、つぶれ文字を学習した文字認識方法を用いて文字を認識することによって、押印による文字の劣化に適した文字認識方法を用いることができ、文字認識の精度を向上できる。   For example, the character recognition unit 318 recognizes a character using the character recognition method that has learned the blurred character when the degree of blurring of the stamp is large, and the character that has learned the blurred character when the degree of collapse of the stamp is large. By recognizing characters using the recognition method, a character recognition method suitable for character deterioration due to stamping can be used, and the accuracy of character recognition can be improved.

辞書利用判定部315によって押印認識用辞書301を用いないで文字を認識すると判定された場合の知識処理部319の処理は、第1の実施形態の知識処理部219の処理と同じであるので、説明を省略する。   Since the processing of the knowledge processing unit 319 when the dictionary use determination unit 315 determines that the character is recognized without using the seal recognition dictionary 301 is the same as the processing of the knowledge processing unit 219 of the first embodiment, Description is omitted.

辞書利用判定部315によって押印認識用辞書301を用いて文字を認識すると判定された場合には、知識処理部319は、文字認識結果の形式と、押印認識用辞書301に登録された押印情報のうち押印種特定部331によって特定された押印種別の押印文字列形式1306に登録されている形式とが一致する文字認識結果を選択する。   When the dictionary use determination unit 315 determines that the character is to be recognized using the seal recognition dictionary 301, the knowledge processing unit 319 displays the format of the character recognition result and the seal information registered in the seal recognition dictionary 301. Among them, the character recognition result that matches the format registered in the stamp character string format 1306 of the stamp type specified by the stamp type specifying unit 331 is selected.

リトライ判定部321は、本発明の第1の実施形態のリトライ判定部221によって実行される処理の他に、辞書利用判定部315によって押印認識用辞書301を用いないで文字を認識すると判定された場合の文字認識がリトライと判定されると、押印認識用辞書301を用いて再度文字を認識するようにしてもよい。   In addition to the processing executed by the retry determination unit 221 according to the first embodiment of the present invention, the retry determination unit 321 determines that the dictionary use determination unit 315 recognizes a character without using the stamp recognition dictionary 301. If the character recognition in this case is determined to be a retry, the character may be recognized again using the stamp recognition dictionary 301.

押印種特定部331は、押印認識用辞書301に登録された押印情報を用いて、押印の種類を特定する。   The stamp type identification unit 331 identifies the type of stamp using the stamp information registered in the stamp recognition dictionary 301.

まず、押印認識用辞書301を図13を用いて説明する。   First, the stamp recognition dictionary 301 will be described with reference to FIG.

図13は、本発明の第2の実施形態の押印認識用辞書301の説明図である。   FIG. 13 is an explanatory diagram of the stamp recognition dictionary 301 according to the second embodiment of this invention.

押印認識用辞書301は、押印ID1301、押印テンプレート画像1302、押印形状1303、押印サイズ1304、押印文字列位置1305、押印文字列形式1306、個々の文字位置1307、及び押印色1308を含む。   The stamp recognition dictionary 301 includes a stamp ID 1301, a stamp template image 1302, a stamp shape 1303, a stamp size 1304, a stamp character string position 1305, a stamp character string format 1306, individual character positions 1307, and a stamp color 1308.

押印ID1301には、押印の種別の一意な識別子が登録される。押印テンプレート画像1302には、押印の種別ごとのテンプレート画像が登録される。押印テンプレート画像1302に登録されるテンプレート画像は、二値画像又は多値画像(グレー画像)である。   In the seal ID 1301, a unique identifier of the seal type is registered. A template image for each type of stamp is registered in the stamp template image 1302. The template image registered in the stamp template image 1302 is a binary image or a multi-value image (gray image).

押印形状1303には、押印の種別ごとに押印の形状が円であるか、長方形であるか、楕円であるか等が登録される。押印サイズ1304には、押印の形状が円である場合には半径が登録され、押印の形状が長方形である場合には縦の長さ及び横の長さが登録され、押印が楕円である場合には短径及び長径が登録される。   In the stamp shape 1303, for each type of stamp, whether the shape of the stamp is a circle, a rectangle, an ellipse, or the like is registered. In the stamp size 1304, when the stamp shape is a circle, a radius is registered. When the stamp shape is a rectangle, the vertical length and the horizontal length are registered. When the stamp is an ellipse The minor axis and major axis are registered in.

押印文字列位置1305には、押印に存在する文字列の種類ごとに文字列が押印中に存在する座標が登録される。文字列の種類には、例えば、年月日を示す文字列の種類と銀行の支店名を示す文字列の種類とがある。押印文字列位置1305には、例えば、押印の外接矩形の左下の角の座標を基準にした文字列が存在する座標が登録される。   In the stamped character string position 1305, coordinates where the character string exists during the stamping are registered for each type of the character string present in the stamp. Examples of character string types include a character string type indicating a date and a character string type indicating a bank branch name. In the stamped character string position 1305, for example, coordinates where a character string exists based on the coordinates of the lower left corner of the circumscribed rectangle of the stamp are registered.

押印文字列形式1306には、同じ種類の押印に存在する文字列の種類ごとの文字列の形式が登録される。例えば、年月日を示す文字列の種類の押印文字列形式1306には、YYMMDDが登録される。YYMMDDは、6桁の数字から構成される文字列であることを示し、YYは年を表し00〜99の数字からなり、MMは月を表し01〜12の数字からなり、DDは日を表し01〜31の数字からなる。また、支店名を示す文字列の種類の押印文字列形式1306には、XX支店が登録される。   In the stamp character string format 1306, the format of a character string for each type of character string existing in the same type of stamp is registered. For example, YYMMDD is registered in the stamp character string format 1306 of the character string type indicating the date. YYMMDD indicates a character string composed of 6-digit numbers, YY indicates the year and the numbers 00 to 99, MM indicates the month and the numbers 01 to 12, and DD indicates the day. It consists of a number from 01 to 31. Further, the XX branch is registered in the stamp character string format 1306 of the character string type indicating the branch name.

個々の文字位置1307には、同じ種類の押印に存在する文字列を構成する各文字の位置を示す座標が登録される。年月日を示す文字列の種類の個々の文字位置1307には、年を示す個々の文字の位置の座標、月を示す個々の文字の位置の座標、及び日を示す個々の文字の位置の座標が登録される。なお、個々の文字位置1307には、押印文字列位置1305と同じく、例えば、押印の外接矩形の左下の角の座標を基準にした文字列が存在する座標が登録される。   In each character position 1307, coordinates indicating the position of each character constituting a character string existing in the same type of seal are registered. Each character position 1307 of the character string type indicating the year, month, day includes the coordinates of the position of each character indicating the year, the coordinates of the position of each character indicating the month, and the position of each character indicating the day. Coordinates are registered. As in the case of the stamp character string position 1305, for example, the coordinates at which the character string exists based on the coordinates of the lower left corner of the circumscribed rectangle of the stamp are registered in each character position 1307.

押印色1308には、同じ種類の押印の押印色が登録される。押印色は背景色分離部213によって抽出される。   In the stamp color 1308, the stamp color of the same type of stamp is registered. The stamp color is extracted by the background color separation unit 213.

図12に戻り、押印種特定部331を説明する。   Returning to FIG. 12, the stamp type identification unit 331 will be described.

押印種特定部331は、傾き補正部214によって生成された傾き補正後の押印画像と押印認識用辞書301の押印テンプレート画像1302とを比較することによって、押印画像の種別を特定する。   The stamp type identification unit 331 identifies the type of the stamp image by comparing the stamp image after the tilt correction generated by the tilt correction unit 214 with the stamp template image 1302 of the stamp recognition dictionary 301.

押印画像の種別特定処理について説明する。   The type specifying process of the stamp image will be described.

まず、押印種特定部331は、押印認識用辞書301に登録された押印種別のうち、押印形状1303に登録された形状と押印検出部212によって検出された押印画像の形状と一致するエントリを選択する。そして、押印種特定部313は、選択されたエントリの押印サイズ1304に登録されたサイズと押印検出部212によって検出された押印画像のサイズとの差が所定の閾値以下であるエントリの押印テンプレート画像1302に登録されたテンプレート画像を選択する。押印種特定部331は、選択されたテンプレート画像と押印画像とを比較する。   First, the stamp type identification unit 331 selects an entry that matches the shape registered in the stamp shape 1303 and the shape of the stamp image detected by the stamp detection unit 212 among the stamp types registered in the stamp recognition dictionary 301. To do. The stamp type specifying unit 313 then selects a stamp template image of an entry whose difference between the size registered in the stamp size 1304 of the selected entry and the size of the stamp image detected by the stamp detection unit 212 is equal to or less than a predetermined threshold. A template image registered in 1302 is selected. The stamp type specifying unit 331 compares the selected template image with the stamp image.

次に、押印種特定部331は、押印画像の中心とテンプレート画像の中心とを合わせてどちらの画像の輪郭が大きいかを判定する。押印種特定部331は、輪郭が大きいと判定された方の画像に余白等を追加し、両方の画像の輪郭が一致するようにする。   Next, the stamp type specifying unit 331 determines which image has the larger outline by combining the center of the stamp image and the center of the template image. The stamp type specifying unit 331 adds a margin or the like to the image determined to have a large outline so that the outlines of both images match.

そして、押印種特定部331は、押印画像pとテンプレート画像qとを、関数K(p,q)を用いて比較する。以下、押印画像及びテンプレート画像は、二値画像又はグレー画像であるものとし、黒画素が1、白画素が0となるように正規化されているものとする。また、画像位置xに位置する押印画像pの画素値をp(x)とし、テンプレート画像の画素qの画素値をq(x)とする。   Then, the stamp type specifying unit 331 compares the stamp image p and the template image q using the function K (p, q). Hereinafter, it is assumed that the stamp image and the template image are binary images or gray images, and are normalized so that black pixels are 1 and white pixels are 0. Further, the pixel value of the stamp image p located at the image position x is p (x), and the pixel value of the pixel q of the template image is q (x).

以下に、押印画像pとテンプレート画像qとを比較するために用いられる関数の例を説明する。   Below, an example of a function used for comparing the stamp image p and the template image q will be described.

押印画像pとテンプレート画像qとの比較に用いられる関数には、f(a、b)を|a−b|の値に応じて広義単調増加する関数である数式1に示すK(p,q)がある。数式1では、全画素にわたって和が算出される。   As a function used for comparing the stamp image p and the template image q, K (p, q shown in Equation 1 which is a function that monotonically increases f (a, b) according to the value of | a−b |. ) In Equation 1, the sum is calculated over all pixels.

本実施形態の押印種特定部331は、広義単調増加する関数として、例えば、数式2〜数式5に示す関数を用いることができる。   As the function that increases monotonously in a broad sense, for example, the functions shown in Formulas 2 to 5 can be used by the stamp type identification unit 331 of the present embodiment.

まず、数式2及び数式3について説明する。   First, Formula 2 and Formula 3 will be described.

数式1に示す関数では、押印画像pの画素値p(x)とテンプレート画像qとの画素値q(x)との差の絶対値の和がすべての画素位置に対して算出される。   In the function shown in Equation 1, the sum of absolute values of differences between the pixel value p (x) of the stamp image p and the pixel value q (x) of the template image q is calculated for all pixel positions.

数式3に示す関数では、押印画像pの画素値p(x)とテンプレート画像qとの画素値q(x)との差の絶対値を二乗した値の和がすべての画素位置に対して算出される。   In the function shown in Equation 3, the sum of values obtained by squaring the absolute value of the difference between the pixel value p (x) of the stamp image p and the pixel value q (x) of the template image q is calculated for all pixel positions. Is done.

数式2及び数式3に示す関数では、押印画像pの画素値p(x)とテンプレート画像qの画素値q(x)との違いが大きいほど、K(p,q)の値が大きくなる。このため、押印種特定部331は、押印画像pとテンプレート画像qとの比較に数式2又は数式3に示す関数を用いた場合には、K(p,q)の値が最小となるテンプレート画像qを押印種別を示す画像として特定する。   In the functions shown in Equation 2 and Equation 3, the value of K (p, q) increases as the difference between the pixel value p (x) of the stamp image p and the pixel value q (x) of the template image q increases. For this reason, when the function shown in Formula 2 or Formula 3 is used for the comparison between the stamp image p and the template image q, the stamp type specifying unit 331 has a template image that minimizes the value of K (p, q). q is specified as an image indicating the type of stamp.

次に、数式4及び数式5について説明する。   Next, Formula 4 and Formula 5 will be described.

数式4に示す関数では、押印画像pの画素値p(x)がテンプレート画像qの画素値q(x)よりも大きくなる画素に対してのみ演算する。また、数式5に示す関数では、テンプレート画像qの画素値q(x)が0よりも大きく、かつ押印画像pの画素値p(x)が0よりも大きい画素に対してのみ演算する。   In the function shown in Formula 4, the calculation is performed only for pixels in which the pixel value p (x) of the stamp image p is larger than the pixel value q (x) of the template image q. In the function shown in Formula 5, the calculation is performed only for pixels in which the pixel value q (x) of the template image q is larger than 0 and the pixel value p (x) of the stamped image p is larger than 0.

数式4及び数式5に示す関数は、K(p,q)とK(q,p)とが異なる非対称関数である。なお、数式2及び数式3に示す関数は、K(p,q)とK(q,p)とが同じになる対称関数である。   The functions shown in Equation 4 and Equation 5 are asymmetric functions in which K (p, q) and K (q, p) are different. Note that the functions shown in Equation 2 and Equation 3 are symmetric functions in which K (p, q) and K (q, p) are the same.

数式4及び数式5に示す関数では、テンプレート画像qと比較して押印画像pがつぶれているほど、換言すると、押印画像pと比較してテンプレート画像qがかすれているほど、K(p,q)の値が大きくなる。つまり、押印画像pで黒に近い画素がテンプレート画像qよりも多いほど、K(p,q)の値が大きくなる。数式4において、押印画像pと比較してテンプレート画像qがかすれているほどK(p,q)の値が大きくなるのは、p>qとなるような画素に対してのみ演算しているからである。   In the functions shown in Equation 4 and Equation 5, the more the stamp image p is crushed compared to the template image q, in other words, the more the template image q is faint compared to the stamp image p, the more K (p, q ) Value increases. In other words, the value of K (p, q) increases as the number of pixels close to black in the stamp image p is larger than that in the template image q. In Equation 4, the value of K (p, q) increases as the template image q becomes faint compared to the stamped image p because it is calculated only for pixels that satisfy p> q. It is.

また、数式5において、押印画像pと比較してテンプレート画像qがかすれているほどK(p,q)の値が大きくなるのは、log(q(x)/p(x))が、p(x)>q(x)のときに値が正となり、数式5の和の中のlog((q(x)+ε)/p(x))は、q(x)=0となるときにも演算できるように、正の実数ε>0でlog(q(x)/p(x))を、補正したものだからである。   In Equation 5, the value of K (p, q) increases as the template image q becomes faint compared to the stamp image p because log (q (x) / p (x)) is p When (x)> q (x), the value is positive, and log ((q (x) + ε) / p (x)) in the sum of Equation 5 is when q (x) = 0. This is because log (q (x) / p (x)) is corrected with a positive real number ε> 0 so that can be calculated.

テンプレート画像qが示す押印の種別が押印画像pの押印の種別と同じである場合には、テンプレート画像qを基準とした押印画像pのつぶれ度がK(p,q)によって算出でき、テンプレート画像qを基準とした押印画像pのかすれ度がK(q,p)によって算出できる。   When the type of the stamp indicated by the template image q is the same as the type of the stamp of the stamped image p, the degree of crushing of the stamped image p with the template image q as a reference can be calculated by K (p, q). The faintness of the stamped image p with reference to q can be calculated by K (q, p).

なお、K(p,q)がテンプレート画像qを基準とした押印画像pのかすれ度を示し、K(q,p)がテンプレート画像qを基準とした押印画像pのつぶれ度を示すようにすることもできる。具体的には、数式4では、押印画像pの画素値p(x)がテンプレート画像qの画素値q(x)よりも大きくなる画素に対してのみ演算しているが、テンプレート画像qの画素値q(x)が押印画像pの画素値p(x)よりも大きくなる画素に対してのみ演算するようにすればよい。また、数式5では、押印画像pの画素値p(x)がp(x)>0となる画素に対してのみ演算しているが、数式5において、pとqを入れ替え、q(x)>0となるような画素に対してのみ、演算するようにすればよい。   K (p, q) indicates the degree of fading of the stamp image p with the template image q as a reference, and K (q, p) indicates the degree of collapse of the stamp image p with the template image q as a reference. You can also Specifically, in Expression 4, calculation is performed only for pixels in which the pixel value p (x) of the stamp image p is larger than the pixel value q (x) of the template image q. It suffices to perform calculation only for pixels whose value q (x) is larger than the pixel value p (x) of the stamped image p. Further, in Expression 5, calculation is performed only for pixels in which the pixel value p (x) of the stamped image p is p (x)> 0. However, in Expression 5, p and q are interchanged, and q (x) It suffices to perform computation only for pixels that are> 0.

ここで、押印種特定部331は、数式4又は数式5に示す関数を用いて押印画像pの押印種別を特定する場合には、α及びβを定数として、αK(p,q)+βK(q,p)の値が最小となるテンプレート画像qを押印種別を示す画像として特定する。   Here, when the stamp type identifying unit 331 identifies the stamp type of the stamp image p using the function shown in Formula 4 or Formula 5, αK (p, q) + βK (q , P), the template image q having the minimum value is specified as an image indicating the stamp type.

次に、押印劣化判定部332について説明する。   Next, the stamp deterioration determination unit 332 will be described.

押印劣化判定部332は、押印画像pと、当該押印画像pに対応する押印種別のテンプレート画像qとを比較することによって、押印画像pの劣化度を判定し、押印画像pの劣化度に対応する文字認識方法を選択して、文字列探索部316へ処理を移行する。なお、押印劣化判定部332は、押印画像pの劣化度が所定値以上である場合には、当該押印画像の文字を認識しないように、文字列探索部316へ処理を移行させないようにしてもよい。   The stamp deterioration determination unit 332 determines the degree of deterioration of the stamp image p by comparing the stamp image p with the template image q of the stamp type corresponding to the stamp image p, and corresponds to the degree of deterioration of the stamp image p. The character recognition method to be selected is selected, and the process proceeds to the character string search unit 316. If the degree of deterioration of the stamp image p is equal to or greater than a predetermined value, the stamp deterioration determination unit 332 does not shift the processing to the character string search unit 316 so that the character of the stamp image is not recognized. Good.

押印劣化判定部332は、押印画像pの劣化度の判定には、数式1〜5を用いてもよい。例えば、数式2及び数式3に示す関数を用いてもよい。この場合、押印劣化判定部332は、数式2及び数式3に示す関数のK(p,q)の値が大きいほど、押印画像pの劣化が大きいものと判定する。   The stamp deterioration determination unit 332 may use Formulas 1 to 5 to determine the degree of deterioration of the stamp image p. For example, the functions shown in Formula 2 and Formula 3 may be used. In this case, the stamp deterioration determination unit 332 determines that the deterioration of the stamp image p is larger as the value of K (p, q) of the function shown in Expression 2 and Expression 3 is larger.

また、押印劣化判定部332は、数式4及び数式5に示す関数(K(p,q)及びK(q,p))を用いて、押印画像pのつぶれ度及びかすれ度を劣化度として判定してもよい。数式4及び数式5に示す関数を用いた場合には、押印劣化判定部332は、K(p,q)の値が大きければ押印画像pのつぶれによる劣化度が大きいと判定し、つぶれが大きい場合の文字認識方法を選択する。一方、K(q,p)の値が大きければ押印画像pのかすれによる劣化度が大きいと判定し、かすれが大きい場合の文字認識方法を選択する。   In addition, the seal deterioration determination unit 332 determines the degree of crushing and blurring of the stamp image p as the deterioration level using the functions (K (p, q) and K (q, p)) shown in Expression 4 and Expression 5. May be. When the functions shown in Formula 4 and Formula 5 are used, if the value of K (p, q) is large, the seal deterioration determination unit 332 determines that the degree of deterioration due to the seal of the stamp image p is large, and the collapse is large. Select the character recognition method. On the other hand, if the value of K (q, p) is large, it is determined that the degree of deterioration due to the blur of the stamped image p is large, and the character recognition method when the blur is large is selected.

以上によって、本実施形態では、押印認識用辞書301に登録された文字の位置情報のうち、認識する押印と同じ種類の文字の位置情報を用いて、認識する押印に存在する文字を認識する。押印の種類ごとに、当該押印に存在する文字の位置等は決まっているので、帳票認識装置101は正確に文字認識を行うことができる。例えば、日付の年、月、日の位置は印鑑のベルト位置によって決まっているため、日付区切り点であるピリオドが消失している場合であっても、帳票認識装置101は正確に年月日を認識できる。   As described above, in the present embodiment, the character existing in the recognized seal is recognized using the same position information of the character as the recognized seal among the character position information registered in the seal recognition dictionary 301. Since the position of the character existing in the stamp is determined for each type of stamp, the form recognition apparatus 101 can perform character recognition accurately. For example, since the position of the year, month, and day of the date is determined by the belt position of the seal, even if the period that is the date break point disappears, the form recognition device 101 can accurately determine the date. Can be recognized.

また、本実施形態では、押印画像と当該押印画像と同じ種類の押印テンプレート画像とを比較することによって、押印画像の劣化度を判定する。このため、押印画像の劣化度が所定値よりも大きい場合には、押印中の文字認識をさせないようにすることによって、押印画像がかすれ又はつぶれによる劣化がひどく、文字の全部又は一部が欠落している場合の誤認識を低減できる。また、本実施形態では、押印画像の劣化度に応じて文字認識の処理方法を変更する。これによって、押印画像の劣化度合に適した文字認識処理を選択することができるため、文字認識の精度を向上させることができる。   In this embodiment, the degree of deterioration of the stamp image is determined by comparing the stamp image with a stamp template image of the same type as the stamp image. For this reason, when the degree of deterioration of the stamped image is larger than a predetermined value, by preventing the character recognition during the stamping from being performed, the stamped image is severely deteriorated due to blurring or crushing, and all or part of the character is missing. It is possible to reduce misrecognition when the In the present embodiment, the character recognition processing method is changed according to the degree of deterioration of the stamped image. As a result, it is possible to select a character recognition process suitable for the degree of deterioration of the stamped image, so that the accuracy of character recognition can be improved.

次に、学習フェーズについて説明する。   Next, the learning phase will be described.

図14は、本発明の第2の実施形態の押印テンプレート生成処理を実行する各モジュールを説明するための図である。   FIG. 14 is a diagram for explaining each module that executes a stamp template generation process according to the second embodiment of this invention.

押印テンプレート生成処理は、帳票認識処理を実行する帳票認識装置101と異なる装置によって実行されてもよいが、ここでは帳票認識装置101によって実行されるものとする。   The stamp template generation process may be executed by an apparatus different from the form recognition apparatus 101 that executes the form recognition process, but is assumed to be executed by the form recognition apparatus 101 here.

帳票認識装置101は、押印テンプレート生成処理を実行するためのモジュール及びデータベースとして、押印テンプレート生成部401、ユーザ押印登録部402、押印認識用辞書201、及び認識結果DB203を備える。   The form recognition apparatus 101 includes a stamp template generation unit 401, a user stamp registration unit 402, a stamp recognition dictionary 201, and a recognition result DB 203 as a module and database for executing a stamp template generation process.

押印テンプレート生成処理では、帳票認識処理における押印種特定部331による押印画像の押印の種別の特定処理、文字列探索部316による押印中の文字列の位置の特定処理、文字切出部317による押印中の文字の各文字の位置の特定処理、及び押印劣化判定部332による劣化度の判定処理等で用いられる押印認識用辞書301が生成される。   In the stamp template generation process, the stamp type specifying unit 331 in the form recognition process specifies the type of stamp of the stamp image, the character string searching unit 316 specifies the position of the character string being stamped, and the character cutout unit 317 performs the stamp. A seal recognition dictionary 301 is generated that is used in the process of specifying the position of each character in the middle character and the process of determining the degree of deterioration by the seal deterioration determination unit 332.

帳票認識装置101は、ユーザによって直接入力された各種情報を押印認識用辞書301に登録するユーザ押印登録部402、及び帳票認識処理で認識結果DB203に記憶された認識結果を押印認識用辞書301に登録する押印テンプレート生成部401を備える。   The form recognition device 101 stores various information input directly by the user in the seal recognition dictionary 301, and the recognition result stored in the recognition result DB 203 in the form recognition process in the seal recognition dictionary 301. A stamp template generation unit 401 for registration is provided.

押印テンプレート生成部401は、認識結果DB203に記憶された情報等に基づいて帳票を押印の種類ごとに分類する。そして、押印テンプレート生成部401は、分類された押印の種類ごとに押印テンプレート画像を生成し、生成された押印テンプレート画像を押印情報(押印の形状、サイズ、及び押印色等)とともに押印認識用辞書301に登録する。この押印テンプレート生成部401の処理は、押印分類処理、押印テンプレート生成処理、及び押印情報登録処理に分けられる。   The stamp template generation unit 401 classifies the form for each type of stamp based on information stored in the recognition result DB 203. Then, the stamp template generation unit 401 generates a stamp template image for each classified stamp type, and the generated stamp template image together with stamp information (such as the shape, size, and stamp color of the stamp) is a dictionary for stamp recognition. 301 is registered. The process of the stamp template generation unit 401 is divided into a stamp classification process, a stamp template generation process, and a stamp information registration process.

まず、押印テンプレート生成部401の押印分類処理について説明する。   First, the stamp classification process of the stamp template generation unit 401 will be described.

押印分類処理では、押印テンプレート生成部401は、認識結果DB203に記憶された押印画像を、形状、文字認識結果、文字位置、及びサイズ等に基づいて、一つ又は複数の種類に分類する。なお、押印テンプレート生成部401は、文字の認識に失敗している押印画像は分類の対象としなくてもよい。   In the stamp classification process, the stamp template generation unit 401 classifies the stamp image stored in the recognition result DB 203 into one or more types based on the shape, character recognition result, character position, size, and the like. Note that the stamp template generation unit 401 does not need to classify a stamp image in which character recognition has failed.

また、押印分類処理では、押印のうち日付等の文字列は、印鑑に備わるベルトを回転させること等によって変更されるため、押印のうち変更されない文字列(「出納済」、及び「領収」等の文字列)を対象として押印画像を分類する。ただし、変更可能な文字列であっても、変更可能な文字列を構成する文字の位置、及び当該文字の大きさについては不変であるので、押印テンプレート生成部401は、文字の位置、及び当該文字の大きさは取得する。   In the stamp classification process, the character string such as the date of the seal is changed by rotating a belt provided in the seal, etc., so that the character strings that are not changed in the seal (such as “Received”, “Receipt”, etc.) The stamp image is classified as a target. However, even if the character string can be changed, the position of the character constituting the changeable character string and the size of the character are not changed. Get the size of the character.

ここで、押印テンプレート生成部401の押印分類処理を具体的に説明する。   Here, the stamp classification process of the stamp template generation unit 401 will be specifically described.

まず、押印テンプレート生成部401は、認識結果DB203に記憶された押印画像から一つの押印画像を分類対象押印画像として選択し、選択された押印画像と同じ形状の押印画像のうち不変の文字列が選択された押印画像と一致する押印画像を種類押印画像として選択する。   First, the stamp template generation unit 401 selects one stamp image as a classification target stamp image from the stamp images stored in the recognition result DB 203, and an immutable character string of stamp images having the same shape as the selected stamp image is displayed. A stamp image that matches the selected stamp image is selected as a type stamp image.

次に、押印テンプレート生成部401は、種類押印画像のうち、分類対象押印画像のサイズと種類押印画像のサイズとがユーザによって指定された閾値h1よりも小さく、かつ、分類対象押印画像の文字位置と種類押印画像の文字位置とがユーザによって指定された閾値h2よりも小さい押印画像を同一種押印画像として選択する。ただし、両者の文字位置のうち、日付を示す文字列を構成する各文字の文字位置の縦方向のずれは、文字位置の違いとして考慮しない。これは、日付を示す文字列を構成する各文字は、印鑑のベルトの回転によって変更されるものが多く、縦方向のずれは同じ印鑑であっても生じるからである。   Next, the stamp template generation unit 401 has the size of the classification target stamp image and the size of the type stamp image out of the type stamp images smaller than the threshold value h1 specified by the user, and the character position of the classification target stamp image. And a stamp image whose character position of the type stamp image is smaller than the threshold value h2 designated by the user are selected as the same type stamp image. However, the vertical displacement of the character positions of the characters constituting the character string indicating the date is not considered as a difference in character positions. This is because each character constituting the character string indicating the date is often changed by the rotation of the seal belt, and the vertical shift occurs even in the same seal.

次に、押印テンプレート生成部401の押印テンプレート生成処理について説明する。   Next, the stamp template generation process of the stamp template generation unit 401 will be described.

押印テンプレート生成処理では、押印テンプレート生成部401は、押印分類処理で選択された分類対象押印画像と同一種押印画像との間で、中心位置及び輪郭位置のずれがユーザによって指定された閾値h3よりも小さくなるように、両者の画像サイズを適合させる。具体的には、押印テンプレート生成部401は、両者の押印画像の中心位置を合わせて、輪郭が小さい方の押印画像に余白を追加することによって、両者の画像サイズを適合させる。   In the stamp template generation process, the stamp template generation unit 401 uses the threshold value h3 specified by the user to shift the center position and the contour position between the classification target stamp image selected in the stamp classification process and the same kind of stamp image. The image sizes of both are adapted so as to be smaller. Specifically, the stamp template generation unit 401 matches the center positions of both of the stamp images, and adds a margin to the stamp image having the smaller contour, thereby adapting the image sizes of both.

さらに、押印テンプレート生成部401は、両者の押印画像から日付などの可変文字列を取り除く。認識結果DB203には両者の押印画像中の文字位置が登録されているので、押印テンプレート生成部401は、認識結果DB203を参照して、両者の押印画像中の可変文字列の文字位置を特定し、特定した文字位置の画素を白画素に変換する。   Furthermore, the stamp template generation unit 401 removes a variable character string such as a date from both of the stamp images. Since the character positions in both of the stamped images are registered in the recognition result DB 203, the stamp template generating unit 401 refers to the recognition result DB 203 and specifies the character positions of the variable character strings in both of the stamped images. The pixel at the specified character position is converted into a white pixel.

次に、押印テンプレート生成部401は、両者の押印画像を二値化画像に変換する。具体的には、押印テンプレート生成部401は、両者の押印画像を構成する画素のうち輝度値がユーザによって指定された閾値h4以上の画素を黒画素に変換し、輝度値がユーザによって指定された閾値h4より小さい画素を白画素に変換する。   Next, the stamp template generation unit 401 converts both of the stamp images into a binary image. Specifically, the stamp template generation unit 401 converts a pixel whose luminance value is equal to or higher than the threshold value h4 specified by the user among the pixels constituting both of the stamp images to the black pixel, and the luminance value is specified by the user. A pixel smaller than the threshold value h4 is converted into a white pixel.

次に、押印テンプレート生成部401は、二値化画像に変換された両者の押印画像から一つの255階調のグレー画像を生成し、生成したグレー画像を押印テンプレート画像とする。   Next, the stamp template generation unit 401 generates one gray-scale gray image from both of the stamp images converted into the binarized image, and uses the generated gray image as the stamp template image.

押印テンプレート生成部401のグレー画像を生成する処理について説明する。   A process of generating a gray image of the stamp template generation unit 401 will be described.

ここで、同一種押印画像としてN−1個の押印画像が選択されていて、分類対象押印画は1個であるため、両者の押印画像の個数はN個であるものとする。また、二値化画像に変換された両者の押印画像のうち任意の一の押印画像iの画像位置xにおける画素値(黒は1、白は0等とする)をpi(x)とする。   Here, since N-1 stamp images are selected as the same type of stamp image and there is one classification target stamp image, it is assumed that the number of both stamp images is N. Also, the pixel value (1 for black, 0 for white, etc.) at the image position x of any one of the imprinted images converted into the binarized image is defined as pi (x).

グレー画像の画像位置xの画素値p(x)は、p(x)=(p1(x)+…+pN(x))/255によって算出される。   The pixel value p (x) at the image position x of the gray image is calculated by p (x) = (p1 (x) +... + PN (x)) / 255.

グレー画像の押印テンプレート画像が作成されることによって、押印時のインクの濃さの違いによる押印の輪郭及び文字の太さの違いに対する頑健性を向上させることができる。   By creating a stamp template image of a gray image, it is possible to improve robustness against a difference in the outline and character thickness of a stamp due to a difference in ink density at the time of stamping.

次に、押印テンプレート生成部401の押印情報登録処理について説明する。   Next, the stamp information registration process of the stamp template generation unit 401 will be described.

押印情報登録処理では、押印テンプレート生成部401は、押印認識用辞書301に、押印テンプレート生成処理で生成された押印テンプレート画像を登録するためのエントリを新たに生成する。   In the stamp information registration process, the stamp template generation unit 401 newly generates an entry for registering the stamp template image generated by the stamp template generation process in the stamp recognition dictionary 301.

そして、押印テンプレート生成部401は、生成されたエントリの押印テンプレート画像1302に、押印テンプレート生成処理で生成された押印テンプレート画像を登録する。   Then, the stamp template generation unit 401 registers the stamp template image generated by the stamp template generation process in the stamp template image 1302 of the generated entry.

そして、押印テンプレート生成部401は、当該エントリの押印ID1301に一意な識別子を登録し、押印形状1303に押印テンプレート画像の形状を登録する。また、押印テンプレート生成部401は、当該エントリの押印サイズ1304に、押印テンプレート生成処理で生成された押印画像のサイズが登録される。   Then, the stamp template generation unit 401 registers a unique identifier in the stamp ID 1301 of the entry, and registers the shape of the stamp template image in the stamp shape 1303. In addition, the stamp template generation unit 401 registers the size of the stamp image generated by the stamp template generation process in the stamp size 1304 of the entry.

押印テンプレート生成部401は、当該エントリの押印文字列位置1305に、押印テンプレート画像中に存在する文字列の位置を示す座標を登録し、当該エントリの押印文字列形式1306に、押印テンプレート画像中に存在する文字列の形式を登録する。   The stamp template generation unit 401 registers coordinates indicating the position of the character string existing in the stamp template image in the stamp character string position 1305 of the entry, and stores the coordinates in the stamp template string image 1306 of the entry in the stamp template image. Register the existing string format.

また、押印テンプレート生成部401は、当該エントリの個々の文字位置1307に、押印テンプレート画像中に存在する文字列を構成する文字の位置を登録し、当該エントリの押印色1308に、押印色を登録する。   In addition, the stamp template generation unit 401 registers the position of the character constituting the character string existing in the stamp template image in each character position 1307 of the entry, and registers the stamp color in the stamp color 1308 of the entry. To do.

以上のように、押印テンプレート生成部401は、図13に示す押印認識用辞書301を生成する。   As described above, the stamp template generation unit 401 generates the stamp recognition dictionary 301 shown in FIG.

101 帳票認識装置
102 入力装置
103 表示装置
104 イメージ取得装置
105 通信装置
106 演算装置
107 外部記憶装置
201 押印認識用辞書
202 知識処理用辞書
203 認識結果DB
211 イメージ入力部
212 押印検出部
213 背景色分離部
214 傾き補正部
216 文字列探索部
217 文字切出部
218 文字認識部
219 知識処理部
220 棄却判定部
221 リトライ判定部
222 認識結果記録部
223 帳票分類部
301 押印認識用辞書
DESCRIPTION OF SYMBOLS 101 Form recognition apparatus 102 Input apparatus 103 Display apparatus 104 Image acquisition apparatus 105 Communication apparatus 106 Arithmetic apparatus 107 External storage device 201 Dictionary for imprint recognition 202 Knowledge processing dictionary 203 Recognition result DB
211 Image input unit 212 Impression detection unit 213 Background color separation unit 214 Inclination correction unit 216 Character string search unit 217 Character extraction unit 218 Character recognition unit 219 Knowledge processing unit 220 Rejection determination unit 221 Retry determination unit 222 Recognition result recording unit 223 Form Classification part 301 Dictionary for seal recognition

Claims (15)

帳票を光学的に走査することによって得られた帳票画像を取得するイメージ入力部と、
前記イメージ入力部によって取得された帳票画像から押印画像を検出する押印画像検出部と、
前記押印画像の輪郭の色を示す押印色とその他の色とを分離する背景色分離部と、
前記背景色分離部によって前記押印色が前記その他の色と分離された前記押印画像の傾きを補正する傾き補正部と、
前記傾き補正部によって傾きが補正された前記押印画像から文字列を探索し、前記探索された文字列を切り出す文字列探索部と、
前記文字列探索部によって切り出された文字列から、前記文字列を構成する各文字を切り出す文字切出部と、
前記文字切出部によって切り出された各文字を認識し、前記文字列を構成するすべての文字を認識した結果を示す文字認識結果を算出し、前記認識された各文字の信頼度を算出する文字認識部と、
前記文字認識部によって算出された文字認識結果から、予め指定された文字列形式に適合する文字認識結果を選択し、前記選択された文字認識結果に対する信頼度を前記文字認識部によって算出された各文字の信頼度に基づいて算出する知識処理部と、
前記知識処理部によって選択された文字認識結果と当該文字認識結果の信頼度とに基づいて、前記知識処理部によって選択された文字認識結果を棄却するか否かを判定する棄却判定部と、
前記棄却判定部によって前記文字認識部による文字認識結果が棄却された場合に、押印画像の文字を再度認識させるか否かを判定するリトライ判定部と、を備えることを特徴とする帳票認識装置。
An image input unit for acquiring a form image obtained by optically scanning the form;
A stamp image detection unit for detecting a stamp image from the form image acquired by the image input unit;
A background color separation unit that separates the stamp color indicating the color of the outline of the stamp image from other colors;
An inclination correction unit that corrects an inclination of the stamp image in which the stamp color is separated from the other colors by the background color separation unit;
A character string search unit that searches for a character string from the stamped image whose inclination is corrected by the inclination correction unit, and extracts the searched character string;
A character cutout unit that cuts out each character constituting the character string from the character string cut out by the character string search unit;
A character that recognizes each character cut out by the character cutout unit, calculates a character recognition result indicating a result of recognizing all characters constituting the character string, and calculates a reliability of the recognized character A recognition unit;
From the character recognition result calculated by the character recognition unit, select a character recognition result that conforms to a character string format specified in advance, and the reliability for the selected character recognition result is calculated by the character recognition unit A knowledge processing unit that calculates based on the reliability of the character;
A rejection determination unit that determines whether to reject the character recognition result selected by the knowledge processing unit based on the character recognition result selected by the knowledge processing unit and the reliability of the character recognition result;
A form recognition apparatus, comprising: a retry determination unit that determines whether or not to cause a character of a stamped image to be recognized again when the character recognition result by the character recognition unit is rejected by the rejection determination unit.
前記文字認識部によって算出される文字認識結果及び前記イメージ入力部によって取得された帳票画像の認識結果を記録する認識結果記録部と、
前記イメージ入力部によって入力された帳票画像を、前記認識結果データベースに記録された情報に基づいて、所定の条件を満たす帳票画像ごとに分類する帳票分類部と、を備えることを特徴とする請求項1に記載の帳票認識装置。
A recognition result recording unit that records a character recognition result calculated by the character recognition unit and a recognition result of the form image acquired by the image input unit;
A form classification unit that classifies the form image input by the image input unit for each form image satisfying a predetermined condition based on information recorded in the recognition result database. The form recognition apparatus according to 1.
前記背景色分離部は、
前記押印画像検出部によって検出された前記押印画像の外接矩形の縦の長さと横の長さとを算出し、前記算出された縦の長さ及び横の長さのうち長い方の長さをLとし、kを予め設定された1より小さい正の実数とした場合に、前記押印画像の輪郭位置から距離kL以内に存在する画素を輪郭付近の画素として抽出し、
前記抽出された輪郭付近の画素のピーク色から色空間において予め設定された所定範囲の色を押印色として抽出し、
前記抽出された押印色の画素を押印部とし、その他の色の画素を背景部とすることを特徴とする請求項1に記載の帳票認識装置。
The background color separation unit is
A vertical length and a horizontal length of a circumscribed rectangle of the stamp image detected by the stamp image detection unit are calculated, and the longer length of the calculated vertical length and horizontal length is calculated as L. And when k is a positive real number smaller than 1 set in advance, pixels existing within a distance kL from the contour position of the stamp image are extracted as pixels near the contour,
Extracting a predetermined range of colors set in advance in the color space from the peak color of the pixels in the vicinity of the extracted contour,
The form recognition apparatus according to claim 1, wherein the extracted pixel of the stamp color is used as a stamp unit, and the pixels of other colors are used as a background unit.
前記傾き補正部は、前記背景色分離部によって前記押印色が前記その他の色と分離された前記押印画像の輪郭よりも内側に存在する線分を検出し、前記検出された線分に基づいて前記押印画像の傾きを算出し、前記算出された押印画像の傾きを補正することを特徴とする請求項1に記載の帳票認識装置。   The inclination correction unit detects a line segment existing inside the outline of the stamp image in which the stamp color is separated from the other colors by the background color separation unit, and based on the detected line segment The form recognition apparatus according to claim 1, wherein an inclination of the stamp image is calculated and the calculated inclination of the stamp image is corrected. 前記棄却判定部は、
前記知識処理部によって選択された文字認識結果に含まれる各文字の信頼度の和を当該文字認識結果に含まれる文字の数で除算することによって、当該文字認識結果の信頼度を算出し、
前記算出された文字認識結果の信頼度が所定の値よりも小さい場合には、前記知識処理部によって選択された文字認識結果を棄却することを特徴とする請求項1に記載の帳票認識装置。
The rejection determination unit
By calculating the reliability of the character recognition result by dividing the sum of the reliability of each character included in the character recognition result selected by the knowledge processing unit by the number of characters included in the character recognition result,
The form recognition apparatus according to claim 1, wherein when the reliability of the calculated character recognition result is smaller than a predetermined value, the character recognition result selected by the knowledge processing unit is rejected.
前記棄却判定部は、前記知識処理部によって選択された文字認識結果が年月日を示す文字列である場合には、年を示す文字の信頼度、月を示す文字の信頼度、及び日を示す文字の信頼度に重み付けをして、前記文字認識結果の信頼度を算出し、
前記年を示す文字の信頼度の重み付けが最も低くされ、次いで前記月を示す文字の信頼度の重み付けが低くされ、前記日を示す文字の信頼度の重み付けが最も高くされることを特徴とする請求項5に記載の帳票認識装置。
The rejection determination unit, when the character recognition result selected by the knowledge processing unit is a character string indicating the year, month, day, the reliability of the character indicating the year, the reliability of the character indicating the month, and the date Weighting the reliability of the indicated character to calculate the reliability of the character recognition result,
The reliability weight of the character indicating the year is lowest, the reliability weight of the character indicating the month is then reduced, and the reliability weight of the character indicating the day is highest. The form recognition device according to Item 5.
同じ種類の押印画像のテンプレート画像である押印テンプレート画像と当該押印テンプレート画像に存在する文字の位置情報とを記憶する押印認識用辞書と、
前記押印認識用辞書を用いて、前記傾き補正部によって傾きが補正された前記押印画像の種類を特定する押印種特定部と、
前記押印認識用辞書を用いて、前記押印種特定部によって種類が特定された前記押印画像に存在する文字の位置情報を取得する文字位置特定部と、
前記傾き補正部によって傾きが補正された前記押印画像と、当該押印画像と同じ種類の押印テンプレート画像とを比較することによって、前記押印画像の劣化度を判定する劣化判定部と、をさらに備えることを特徴とする請求項1に記載の帳票認識装置。
A stamp recognition dictionary that stores a stamp template image that is a template image of the same kind of stamp image and position information of characters existing in the stamp template image;
Using the stamp recognition dictionary, a stamp type identifying unit that identifies the type of the stamp image whose tilt is corrected by the tilt correcting unit;
A character position specifying unit that acquires position information of characters existing in the stamp image whose type is specified by the stamp type specifying unit using the seal recognition dictionary;
A deterioration determining unit that determines the degree of deterioration of the stamped image by comparing the stamped image whose tilt is corrected by the tilt correcting unit with a stamped template image of the same type as the stamped image. The form recognition apparatus according to claim 1.
前記押印認識用辞書には、前記同じ種類の押印画像の押印形状、押印サイズ、前記文字列の形式、前記文字列を構成する各文字の大きさ、及び前記押印色の少なくとも一つが記録され、また、前記押印テンプレート画像に存在する文字の位置情報として、前記押印テンプレート画像に存在する文字列の位置情報、及び前記文字列を構成する各文字の位置情報の少なくとも一つが記憶されることを特徴とする請求項7に記載の帳票認識装置。   The stamp recognition dictionary records at least one of the stamp shape, the stamp size, the character string format, the size of each character constituting the character string, and the stamp color of the same type of stamp image, Further, as the position information of the character existing in the stamp template image, at least one of the position information of the character string existing in the stamp template image and the position information of each character constituting the character string is stored. The form recognition apparatus according to claim 7. 前記押印種特定部は、位置Xの前記押印画像の画素値をp(x)とし、位置Xの前記押印テンプレート画像の画素値をq(x)とした場合に、|p(x)−q(x)|の値に応じて広義単調増加する関数K(p,q)の値が最小となる押印テンプレート画像の種類を、前記押印画像の種類として特定することを特徴とする請求項7に記載の帳票認識装置。   When the pixel value of the stamped image at the position X is p (x) and the pixel value of the stamped template image at the position X is q (x), the stamp type specifying unit | p (x) −q The type of a stamp template image that minimizes the value of a function K (p, q) that increases monotonically in accordance with the value of (x) | is specified as the type of the stamp image. The form recognition device described. 前記押印認識用辞書は、前記押印テンプレート画像に存在する文字列の位置情報、前記文字列を構成する各文字の位置情報、及び前記文字列の形式を記録し、
前記文字列探索部は、前記押印種特定部によって前記押印画像の種類が特定されている場合に、前記押印認識用辞書に記憶された前記文字列の位置情報に基づいて、前記傾き補正部によって傾きが補正された前記押印画像から文字列を探索し、
前記文字切出部は、前記押印種特定部によって前記押印画像の種類が特定されている場合に、前記押印認識用辞書に記憶された前記各文字の位置情報に基づいて、前記文字列探索部によって切り出された文字列を構成する文字を切り出し、
前記文字認識部は、前記押印種特定部によって前記押印画像の種類が特定されている場合に、前記劣化判定部によって判定された前記押印画像の劣化度に応じて文字認識方法を切り換え、
前記知識処理部は、前記押印種特定部によって前記押印画像の種類が特定されている場合には、前記文字認識部によって算出された文字認識結果のうち、前記押印認識用辞書に記憶された前記文字列の形式に適合する文字認識結果を選択することを特徴とする請求項7に記載の帳票認識装置。
The seal recognition dictionary records the position information of the character string existing in the stamp template image, the position information of each character constituting the character string, and the format of the character string,
When the type of the stamp image is specified by the stamp type specifying unit, the character string search unit is based on the position information of the character string stored in the seal recognition dictionary, Search for a character string from the imprinted image with corrected inclination,
The character cutout unit, when the type of the stamp image is specified by the stamp type specifying unit, based on the position information of each character stored in the seal recognition dictionary, the character string search unit Cut out the characters that make up the character string extracted by
The character recognition unit switches the character recognition method according to the degree of deterioration of the stamped image determined by the deterioration determining unit when the type of the stamped image is specified by the stamp type specifying unit,
The knowledge processing unit, when the type of the stamp image is specified by the stamp type specifying unit, out of the character recognition results calculated by the character recognition unit, stored in the stamp recognition dictionary 8. The form recognition apparatus according to claim 7, wherein a character recognition result conforming to a character string format is selected.
前記劣化判定部は、位置Xの前記押印画像の画素値をp(x)とし、位置Xの前記押印テンプレート画像の画素値をq(x)とした場合に、|p(x)−q(x)|の値に応じて広義単調増加する関数K(p,q)の値を前記劣化度とすることを特徴とする請求項7に記載の帳票認識装置。   When the pixel value of the imprinted image at the position X is p (x) and the pixel value of the imprinted template image at the position X is q (x), the deterioration determining unit | p (x) −q ( 8. The form recognition apparatus according to claim 7, wherein a value of a function K (p, q) that monotonously increases in accordance with a value of x) | 前記関数K(p,q)は、前記関数K(p,q)の値と、pとqを入れ替えた関数K(q,p)との値とが異なる非対称関数であり、
前記劣化判定部は、前記関数K(p,q)及び前記関数K(q,p)によって前記押印画像の前記押印テンプレート画像に対するつぶれ度及びかすれ度を算出することを特徴とする請求項11に記載の帳票認識装置。
The function K (p, q) is an asymmetric function in which the value of the function K (p, q) is different from the value of the function K (q, p) obtained by exchanging p and q.
12. The degradation determination unit calculates a degree of crushing and blurring of the imprinted image with respect to the imprint template image using the function K (p, q) and the function K (q, p). The form recognition device described.
押印を含む帳票を帳票認識装置に認識させる帳票認識方法において、
帳票を光学的に走査することによって得られた帳票画像を取得するイメージ入力ステップと、
前記イメージ入力ステップによって取得された帳票画像から押印画像を検出する押印画像検出ステップと、
前記押印画像の輪郭の色を示す押印色とその他の色とを分離する背景色分離ステップと、
前記背景色分離ステップによって前記押印色が前記その他の色と分離された前記押印画像の傾きを補正する傾き補正ステップと、
前記傾き補正ステップによって傾きが補正された前記押印画像から文字列を探索し、前記探索された文字列を切り出す文字列探索ステップと、
前記文字列探索ステップによって切り出された文字列から、前記文字列を構成する各文字を切り出す文字切出ステップと、
前記文字切出ステップによって切り出された各文字を認識し、前記文字列を構成するすべての文字を認識した結果を示す文字認識結果を算出し、前記認識された各文字の信頼度を算出する文字認識ステップと、
前記文字認識ステップによって算出された文字認識結果のうち、予め指定された文字列形式に適合する文字認識結果を選択し、前記選択された各文字認識結果に対する信頼度を前記文字認識ステップによって算出された各文字の信頼度に基づいて算出する知識処理ステップと、
前記知識処理ステップによって選択された文字認識結果と当該文字認識結果の信頼度とに基づいて、前記知識処理ステップによって選択された文字認識結果を棄却するか否かを判定する棄却判定ステップと、
前記棄却判定ステップによって前記文字認識ステップによる文字認識結果が棄却された場合に、押印画像の文字を再度認識させるか否かを判定するリトライ判定ステップと、を備えることを特徴とする帳票認識方法。
In the form recognition method that makes the form recognition device recognize the form including the seal,
An image input step for acquiring a form image obtained by optically scanning the form;
A stamp image detection step of detecting a stamp image from the form image acquired by the image input step;
A background color separating step for separating a stamp color indicating the color of the outline of the stamp image and other colors;
An inclination correction step for correcting an inclination of the stamp image in which the stamp color is separated from the other colors by the background color separation step;
A character string search step of searching for a character string from the stamp image whose inclination is corrected by the inclination correction step, and cutting out the searched character string;
A character extraction step of extracting each character constituting the character string from the character string extracted by the character string search step;
A character that recognizes each character cut out by the character cutting step, calculates a character recognition result indicating a result of recognizing all characters constituting the character string, and calculates a reliability of the recognized character A recognition step;
Of the character recognition results calculated by the character recognition step, select a character recognition result that matches a character string format specified in advance, and the reliability for each selected character recognition result is calculated by the character recognition step. A knowledge processing step to calculate based on the reliability of each character,
A rejection determination step for determining whether to reject the character recognition result selected by the knowledge processing step based on the character recognition result selected by the knowledge processing step and the reliability of the character recognition result;
A form recognition method comprising: a retry determination step of determining whether or not to recognize a character of a stamped image again when the character recognition result of the character recognition step is rejected by the rejection determination step.
前記帳票認識方法は、
前記文字認識ステップによって算出される文字認識結果及び前記イメージ入力ステップによって取得された帳票画像の認識結果を記録する認識結果記録ステップと、
前記イメージ入力ステップによって入力された帳票画像を、前記認識結果データベースに記録された情報に基づいて、所定の条件を満たす帳票画像ごとに分類する帳票分類ステップと、を有することを特徴とする請求項13に記載の帳票認識方法。
The form recognition method is:
A recognition result recording step for recording the character recognition result calculated by the character recognition step and the recognition result of the form image acquired by the image input step;
The form classification step of classifying the form image input in the image input step for each form image satisfying a predetermined condition based on information recorded in the recognition result database. The form recognition method according to 13.
前記帳票認識装置は、同じ種類の押印画像を押印テンプレート画像と当該押印テンプレート画像に存在する文字の位置情報とを記憶する押印認識用辞書を備え、
前記帳票認識方法は、
前記押印認識用辞書を用いて、前記押印画像検出ステップによって検出された前記押印画像の種類を特定する押印種特定ステップと、
前記押印認識用辞書を用いて、前記押印種特定ステップによって種類が特定された前記押印画像に存在する文字の位置情報を取得する文字位置特定ステップと、
前記押印画像検出ステップによって検出された前記押印画像と当該押印画像と同じ種類の押印テンプレート画像とを比較することによって、前記押印画像の劣化度を判定する劣化判定ステップと、を有することを特徴とする請求項13に記載の帳票認識方法。
The form recognition device includes a stamp recognition dictionary that stores a stamp template image of the same type of stamp image and position information of characters existing in the stamp template image,
The form recognition method is:
Using the stamp recognition dictionary, a stamp type specifying step for specifying the type of the stamp image detected by the stamp image detection step;
Using the stamp recognition dictionary, a character position specifying step for acquiring position information of characters existing in the stamp image whose type is specified by the stamp type specifying step;
A deterioration determining step of determining a degree of deterioration of the stamped image by comparing the stamped image detected by the stamped image detecting step with a stamp template image of the same type as the stamped image. The form recognition method according to claim 13.
JP2010143969A 2010-06-24 2010-06-24 Form recognition device and form recognition method Active JP5500480B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010143969A JP5500480B2 (en) 2010-06-24 2010-06-24 Form recognition device and form recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010143969A JP5500480B2 (en) 2010-06-24 2010-06-24 Form recognition device and form recognition method

Publications (2)

Publication Number Publication Date
JP2012008791A JP2012008791A (en) 2012-01-12
JP5500480B2 true JP5500480B2 (en) 2014-05-21

Family

ID=45539258

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010143969A Active JP5500480B2 (en) 2010-06-24 2010-06-24 Form recognition device and form recognition method

Country Status (1)

Country Link
JP (1) JP5500480B2 (en)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
TWI492166B (en) 2012-01-12 2015-07-11 Kofax Inc Systems and methods for mobile image capture and processing
JP6055297B2 (en) * 2012-12-07 2016-12-27 株式会社日立情報通信エンジニアリング Character recognition apparatus and method, and character recognition program
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
CN105518704A (en) * 2013-05-03 2016-04-20 柯法克斯公司 Systems and methods for detecting and classifying objects in video captured using mobile devices
US10037466B2 (en) 2013-08-23 2018-07-31 Nec Corporation Video processing apparatus, video processing method, and video processing program
US9386235B2 (en) 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
JP5940615B2 (en) * 2014-09-09 2016-06-29 株式会社アイエスピー Skew logic character recognition method, program, and portable terminal device for portable terminal device
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
JP6660332B2 (en) * 2017-03-08 2020-03-11 富士通フロンテック株式会社 Seal stamp deterioration judgment program, seal imprint collation device, seal stamp deterioration judgment method
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
JP7015706B2 (en) * 2018-02-13 2022-02-03 株式会社日立情報通信エンジニアリング Computer and document data processing method
JP6550163B1 (en) * 2018-03-29 2019-07-24 三井住友海上火災保険株式会社 Character recognition device, character recognition method and program
JP7209161B2 (en) * 2019-05-20 2023-01-20 京都電子計算株式会社 Character reader and program for character reader
JP7445364B2 (en) * 2019-07-04 2024-03-07 富士通フロンテック株式会社 Image processing program, image processing method, and image processing device
JP2021043500A (en) * 2019-09-06 2021-03-18 富士ゼロックス株式会社 Information processing apparatus and program
CN110659647B (en) * 2019-09-11 2022-03-22 杭州睿琪软件有限公司 Seal image identification method and device, intelligent invoice identification equipment and storage medium
CN111161247B (en) * 2019-12-30 2023-10-20 凌云光技术股份有限公司 Detection method for variable code reading character quality verification
CN112037077B (en) * 2020-09-03 2024-07-09 平安健康保险股份有限公司 Seal identification method, device, equipment and storage medium based on artificial intelligence
CN112861033B (en) * 2021-02-04 2022-04-01 北京三快在线科技有限公司 Method and device for executing service
CN116757886B (en) * 2023-08-16 2023-11-28 南京尘与土信息技术有限公司 Data analysis method and analysis device

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06111066A (en) * 1992-09-25 1994-04-22 Toshiba Corp Seal character reader
JPH08147466A (en) * 1994-11-16 1996-06-07 Sanyo Electric Co Ltd Device and method for detecting deviation angle between two body images
JPH08190610A (en) * 1995-01-12 1996-07-23 Oki Electric Ind Co Ltd Optical character reader
JP2000353215A (en) * 1999-06-11 2000-12-19 Nec Corp Character recognition device and recording medium where character recognizing program is recorded
JP4841881B2 (en) * 2005-07-15 2011-12-21 富士通株式会社 Character recognition program, character recognition device, and character recognition method
JP4861845B2 (en) * 2007-02-05 2012-01-25 富士通株式会社 Telop character extraction program, recording medium, method and apparatus

Also Published As

Publication number Publication date
JP2012008791A (en) 2012-01-12

Similar Documents

Publication Publication Date Title
JP5500480B2 (en) Form recognition device and form recognition method
CN110766014B (en) Bill information positioning method, system and computer readable storage medium
Eskenazi et al. A comprehensive survey of mostly textual document segmentation algorithms since 2008
US7120318B2 (en) Automatic document reading system for technical drawings
Cheriet et al. Character recognition systems: a guide for students and practitioners
US8442319B2 (en) System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking
KR101515256B1 (en) Document verification using dynamic document identification framework
KR101446376B1 (en) Identification and verification of an unknown document according to an eigen image process
US8467614B2 (en) Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images
Gebhardt et al. Document authentication using printing technique features and unsupervised anomaly detection
EP3258422A1 (en) Character segmentation and recognition method
Antonacopoulos et al. ICDAR2015 competition on recognition of documents with complex layouts-RDCL2015
US8587685B2 (en) Method and apparatus for retrieving label
Garz et al. Layout analysis for historical manuscripts using sift features
Diem et al. Text line detection for heterogeneous documents
JP5674615B2 (en) Character recognition device and character recognition method
Caldeira et al. Industrial optical character recognition system in printing quality control of hot-rolled coils identification
US20140268250A1 (en) Systems and methods for receipt-based mobile image capture
CN112989921A (en) Target image information identification method and device
CN113158895A (en) Bill identification method and device, electronic equipment and storage medium
CN111832497B (en) Text detection post-processing method based on geometric features
Mandal et al. Signature segmentation from machine printed documents using contextual information
Salah et al. Adaptive detection of missed text areas in OCR outputs: application to the automatic assessment of OCR quality in mass digitization projects
JP2009223612A (en) Image recognition device and program
Araújo et al. Segmenting and recognizing license plate characters

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120316

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130125

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20130809

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140228

R150 Certificate of patent or registration of utility model

Ref document number: 5500480

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250