JPH0644404A - 印刷物の検査装置 - Google Patents

印刷物の検査装置

Info

Publication number
JPH0644404A
JPH0644404A JP4197209A JP19720992A JPH0644404A JP H0644404 A JPH0644404 A JP H0644404A JP 4197209 A JP4197209 A JP 4197209A JP 19720992 A JP19720992 A JP 19720992A JP H0644404 A JPH0644404 A JP H0644404A
Authority
JP
Japan
Prior art keywords
character
character string
string
printed matter
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4197209A
Other languages
English (en)
Other versions
JP3237906B2 (ja
Inventor
Toshitake Hirasawa
利勇 平沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP19720992A priority Critical patent/JP3237906B2/ja
Publication of JPH0644404A publication Critical patent/JPH0644404A/ja
Application granted granted Critical
Publication of JP3237906B2 publication Critical patent/JP3237906B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】文字部と背景部との濃度差が小さい場合におい
ても、文字列抽出のための2値化のしきい値を最適値に
設定でき、文字列のみを高い精度で抽出して高精度の検
査が可能となる印刷物の検査装置を提供する。 【構成】スキャナ12で印刷物上の画像データを読取
り、画像メモリ16に格納する。画像メモリ16内の濃
淡画像データにより、まず、印刷物の左上部の参照用文
字列を抽出して、その特徴量を算出し、抽出した参照用
文字列について文字認識を行なう。次に、文字抽出が困
難な右下部の文字列について、メモリ19に格納した参
照用文字列の特微量を用いて抽出を行ない、文字認識を
行なう。こうして、文字と模様との反射明度が離れた文
字列と、反射明度が近い文字列の抽出および認識処理を
行なった後、それらの認識結果を互いに照合して、両同
一文字列が一致したときにのみ印刷物を有効であるとす
る有効性の判定を行なう。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、たとえば、2つの同じ
文字列画像を有する印刷物の有効性を検査する印刷物の
検査装置に関する。
【0002】
【従来の技術】従来、模様の上に文字が印刷されている
印刷物における文字の印刷状態を検査する装置に関して
は、たとえば、特開平2−56688号公報に示される
ように、印刷文字の濃淡画像データから濃度ヒストグラ
ムを作成し、その形状から適当なしきい値を決定し、2
値化処理を施した後、文字抽出を行なっていた。
【0003】
【発明が解決しようとする課題】しかし、上記したよう
な従来の方法では、文字と模様との反射明度が近い場
合、濃度ヒストグラムにおけるそれぞれの濃度分布が分
離しておらず、文字を充分に抽出し得る2値化のしきい
値の決定が困難であり、そのため、高精度の検査が行え
ないという問題があった。
【0004】そこで、本発明は、文字部と背景部との濃
度差が小さい場合においても、文字列抽出のための2値
化のしきい値を最適値に設定でき、文字列のみを高い精
度で抽出して高精度の検査が可能となる印刷物の検査装
置を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明の印刷物の検査装
置は、2つ以上の同じ文字列画像を有する印刷物から画
像データを収集する画像入力手段と、この画像入力手段
によって収集された画像データから、前記2つ以上の文
字列のち少なくとも1つの文字列を抽出するとともに、
その抽出した文字列の濃度的特徴量を求め、この求めた
濃度的特徴量に基づき、その他の文字列を抽出する画像
データ処理手段と、この画像データ処理手段によって抽
出された前記2つ以上の文字列をそれぞれ認識する認識
手段と、この認識手段で認識された前記2つ以上の文字
列により前記印刷物の有効性を判定する判定手段とを具
備している。
【0006】
【作用】複数の同一文字列が複数箇所に印刷されている
印刷物において、文字部と背景部との濃度差が小さい箇
所に印刷されている文字列の抽出を行なう際、他の文字
部と背景部との濃度差が大きく抽出容易な箇所に印刷さ
れている文字列の抽出結果を用いて行なうことにより、
文字部と背景部との濃度差が小さい場合においても、文
字列抽出のための2値化のしきい値を最適値に設定して
文字列のみを高い精度で抽出できる。したがって、印刷
物の検査を高精度に行なうことが可能となる。
【0007】
【実施例】以下、本発明の一実施例について図面を参照
して説明する。
【0008】図1は、本実施例に係る印刷物の検査装置
の概略構成を示すものである。図において、11は本装
置全体の制御および各種画像処理を行なうCPU(セン
トラル・プロセッシング・ユニット)であり、このCP
U11には、印刷物から画像データを収集するイメージ
スキャナ12、ディスク装置13、ディスプレイ装置1
4、動作の指示などを入力するキーボード15、画像メ
モリ16,17,18、参照用文字列における各文字の
特徴量を格納するメモリ19、および、初期値や基準値
などを記憶するためのメモリ20が接続されている。
【0009】画像メモリ16は、イメージスキャナ12
により収集される原画像データを格納するものであり、
画像メモリ17は、画像入力系の高周波ノイズの抑制処
理やエッジのコントラストを強調するためのフィルタリ
ング処理を施したデータを格納するものである。画像メ
モリ18は、文字抽出に用いる2値画像データを格納す
るものである。メモリ19は、2値化の際に用いる参照
用文字列に関する特徴量(詳細については後述)を格納
するものである。
【0010】図2は、検査対象となる印刷物の一例を示
している。この印刷物31には、たとえば、同一の文字
列が2箇所に印刷され、左上部に印刷された一方の文字
列32aは、文字と模様との反射明度の差が大きく(文
字部と背景部との濃度差が大きく)、一般的に文字抽出
し易い文字列であり、右下部に印刷された他方の文字列
32bは、文字と模様との反射明度の差が小さく(文字
部と背景部との濃度差が小さく)、一般的に文字抽出し
難い文字列であると仮定する。
【0011】次に、図2の印刷物31を例にとって、図
3の印刷物検査の処理手順を示すフローチャートを参照
して本発明の検査方法を説明する。まず、イメージスキ
ャナ12によって印刷物31の画像データが読取られ、
収集された濃淡画像データ(以下、濃度が低いことは明
度が低いこととする)は画像メモリ16に格納される
(S1)。
【0012】画像データの収集が終了すると、まず、印
刷物31の左上部の文字列32aを抽出して、その特徴
量を算出する(S2)。この算出された特微量はメモリ
19に格納され、一方の文字列の文字抽出の参照データ
となる。ここで、ステップS2における参照用文字列の
抽出および特微量算出の方法について説明する。
【0013】図4は、上記参照用文字列の抽出および特
微量算出を行なう際の処理手順の概略を示すフローチャ
ートである。まず、抽出しようとする文字列を含む大ま
かな領域(たとえば、i×j画素)を、キーボード15
を用いて指定する(S8)。そして、画像メモリ16内
の濃淡画像データに対し、上記指定領域内の画像データ
について濃度ヒストグラムを作成すると、一般に図5に
示すように、文字部および模様部を示す2つの山が現わ
れる。ここで、たとえば濃度ヒストグラムを解析するこ
とにより、2つの山(極大値)間でのヒストグラムの極
小値を与える濃度値tmを求め(S9)、このtmによ
って濃淡画像データをしきい値処理することにより、左
上部の文字列32aを2値画像として抽出する(S1
0)。
【0014】次に、抽出した2値化データについて、横
方向および縦方向にそれぞれ抽出画素で累積することに
より、図6に示すような周辺分布を求める(S11)。
横方向に累積した周辺分布から、たとえば、「非0」分
布の範囲(つまり、文字画像に係る画素が1画素でも存
在する範囲)を文字領域の縦方向とし、また、同様に縦
方向に累積したときの分布から、たとえば、複数の「非
0」分布の範囲を各文字の横方向として、図7に示すよ
うに各文字の領域を検出して文字抽出を行なう(S1
2)。
【0015】文字の抽出が終了すると、後の2値化処理
で用いる文字の特微量として、各文字における文字部の
画素数、および、それらの総和である文字列の全画素数
を計数し、それを文字の特徴量としてメモリ19に格納
する(S13)。
【0016】このようにして、参照用文字列32aの抽
出、および、その文字の特微量(画素数)の算出を行な
うと、次に、抽出された参照用文字列32aの各文字に
ついて、辞書パターンとの比較処理を行なうことにより
文字の認識を行ない、その認識結果をメモリ20に格納
する(S3)。
【0017】参照用文字列32aの認識が終了すると、
次に、文字と模様との反射明度が近いために、文字抽出
が困難な右下部の文字列32bについて、メモリ19に
格納した左上部の参照用文字列32aの特微量を用いて
文字抽出を行なう(S4)。ここで、ステップS4にお
ける文字列の抽出方法について説明する。
【0018】図8は、上記文字列の抽出を行なう際の処
理手順の概略を示すフローチャートである。まず、画像
メモリ16に格納された濃淡画像データから、ステップ
S8と同様に、抽出しようとする文字列を含む大まかな
領域(たとえば、i×j画素)を、キーボード15を用
いて指定する(S14)。
【0019】次に、上記指定された領域内の画像データ
に対してフィルタリング処理を行ない、その結果を画像
メモリ17に格納する(S15)。このフィルタリング
処理の一例は、たとえば、図12に示すような3×3マ
スクの空間フィルタを用いた平滑化であり、図9に示す
ように、文字列の背景部に存在する高周波成分を含む斜
線などの繰返しパターンPを除去するのに有効である。
【0020】フィルタリング処理が終了すると、画像メ
モリ16内の濃淡画像データのうち、上記指定領域内の
画像データについて濃度ヒストグラムを作成し、文字領
域を切出すためのしいき値を決定する。ところが、図1
1に示すように、右下部の文字列32bは、文字と模様
との反射明度が近いため、濃度ヒストグラムが1つの山
になってしまう。そこで、文字列32aと文字列32b
の文字部全画素数がほぼ一致し、背景部に比べて文字部
の濃度が低いという前提で、先にメモリ19に格納して
おいた文字列32aの文字部全画素数を用いて、ステッ
プS4で指定した全画素数(i×j)に対する文字列3
2aの文字部全画素数の占める割合r%を算出し、濃度
ヒストグラムの累積値の低い方からr%になる濃度値を
求める(S16)。
【0021】こうして求めた濃度値をしきい値として文
字列32bの2値化を行ない、その結果を画像メモリ1
8に格納しておく(S17)。この後、文字列32aの
2値画像から周辺分布および各文字領域を求めたステッ
プS11,S12と同様の手順で、画像メモリ18に格
納した2値画像から図10に示すような周辺分布を求め
(S18)、各文字領域を検出する(S19)。
【0022】このとき、前記一様なしきい値により得ら
れる2値画像は、たとえば、図13(a)に示すよう
に、文字「M」のようなかすれた文字を含んでしまう。
そこで、文字かすれをなくすべく、しきい値レベルを上
げると、図13(b)に示すように、文字「682」の
背景にノイズ成分Nが重なってしまう。すなわち、ステ
ップS17のような全領域を一様なしきい値で2値化す
ることでは、充分な文字抽出ができない。したがって、
ステップS15で格納したフィルタリング後の濃淡画像
データに対して、さらに細かい領域、たとえば、1文字
ごとにしきい値を再設定して文字抽出を行なう。
【0023】すなわち、ステップS16と同様に、メモ
リ19に格納した文字列32aの各文字の画素数を用い
て、各文字領域の全画素数に対する各文字部画素数の占
める割合r1,r2,…rn%(n=文字数)を計算し、各
文字領域における濃度ヒストグラムの累積値が濃度の低
い方からr1,r2,…rn%になる各濃度値を求める(S
20)。これらの濃度値を各文字ごとのしきい値として
各文字領域ごとに2値化処理を行ない、その結果を画像
メモリ18に格納して文字抽出を終了する(S21)。
【0024】このようにして、文字列32bの抽出を行
なうと、次に、文字列32aと同様に、文字列32bの
各文字について文字認識を行ない、その結果をメモリ2
0に格納する(S5)。
【0025】以上のようにして、印刷物31に印刷され
た文字と模様との反射明度が離れた文字列32aと、文
字と模様との反射明度が近い文字列32bの抽出、およ
び、認識処理を行なった後、最後に2つの同一文字列3
2a,32bに対する認識結果を互いに照合して(S
6)、たとえば、2つの同一文字列32a,32bの各
文字認識結果が全て一致したときにのみ、印刷物31を
有効であるとするなどの、印刷物31の有効性の判定を
行なう(S7)。
【0026】このように、たとえば、同一文字列が2箇
所に印刷されていて、一方の文字列は文字と模様との反
射明度の差が大きく、他方の文字列は文字と模様との反
射明度の差が小さい印刷物において、文字と模様との反
射明度の差が小さい文字列を2値化して抽出する際、文
字と模様との反射明度の差が大きい文字列の2値化結果
を用い、各文字ごとの文字部画素数および文字部全画素
数を参照して2値化を行なうことにより、文字と模様と
の反射明度の差が小さい場合においても、文字列抽出の
ための2値化のしきい値を最適値に設定して文字列のみ
を高い精度で抽出できる。したがって、印刷物の有効性
検査などを高精度に行なうことが可能となる。
【0027】なお、前記実施例では、文字と模様との反
射明度の差が大きい文字列、および、文字と模様との反
射明度の差が小さい文字列の、それぞれ1箇所ずつ同一
文字列が印刷された場合について説明したが、上記場合
に加えて、文字と模様との反射明度の差が小さい文字列
が複数個ある場合など、3つ以上の同一文字列が印刷さ
れていても、少なくとも1箇所に文字と模様との反射明
度の差が大きい文字列が印刷されていれば、本発明が適
応できる。
【0028】また、前記実施例では、全画素数(i×
j)に対する文字列32aの文字部全画素数の占める割
合r%、および、各文字領域の全画素数に対する各文字
部画素数の占める割合r1,r2,…rn%(n=文字数)
を用いているが、これらの割合r%、および、r1,r2,
…rn%は、入力画像データおよび参照用文字列の2値
化レベルなどの条件によって変動させることもできる。
【0029】また、前記実施例では、ある参照する文字
列を構成する、それぞれの文字の特徴情報として、文字
部の画素数(面積)、および、文字部の濃度が模様部よ
りも濃いことを用いているが、これに限らず、たとえ
ば、文字の周囲長、文字幅、重心、連結成分数などの幾
何学的特徴量、および、文字部の濃淡画像データの分散
などの濃度的特徴量を採用、および、組合わせて、2値
化しきい値の決定に用いることができる。
【0030】さらに、前記実施例では、濃淡画像データ
を用いた場合について説明したが、カラー画像データの
入力を行ない、色を構成する、たとえばR,G,Bの画
像データを用いた場合においても、各種変換を行なった
結果を濃淡画像データとして扱い、前記列挙した特徴情
報を2値化しきい値の決定に用いることができる。
【0031】
【発明の効果】以上詳述したように本発明によれば、文
字部と背景部との濃度差が小さい場合においても、文字
列抽出のための2値化のしきい値を最適値に設定でき、
文字列のみを高い精度で抽出して高精度の検査が可能と
なる印刷物の検査装置を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る印刷物の検査装置の構
成を概略的に示すブロック図。
【図2】検査対象印刷物の一例を示す平面図。
【図3】印刷物検査の処理手順を示すフローチャート。
【図4】参照用文字列の抽出および特徴量算出の処理手
順を示すフローチャート。
【図5】参照用文字列の濃度ヒストグラムを示す図。
【図6】周辺分布の算出を説明する図。
【図7】文字領域の抽出を説明する図。
【図8】文字列抽出の処理手順を示すフローチャート。
【図9】フィルタリング処理の効果を説明する図。
【図10】周辺分布の算出を説明する図。
【図11】文字部の濃度ヒストグラムとしきい値との関
係を示す図。
【図12】フィルタリング処理に用いる3×3マスクの
一例を示す図。
【図13】文字の2値化例を示す図。
【符号の説明】
11…CPU、12…イメージスキャナ、16,17,
18…画像メモリ、19,20…メモリ、31…印刷
物、32a,32b…文字列。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 2つ以上の同じ文字列画像を有する印刷
    物から画像データを収集する画像入力手段と、 この画像入力手段によって収集された画像データから、
    前記2つ以上の文字列のうち少なくとも1つの文字列を
    抽出する第1文字列抽出手段と、 この第1文字列抽出手段によって抽出された文字列の濃
    度的特徴量を算出する濃度的特徴量算出手段と、 この濃度的特徴量算出手段によって算出された濃度的特
    徴量に基づき、その他の文字列を抽出する第2文字列抽
    出手段と、 前記第1文字列抽出手段および第2文字列抽出手段によ
    って抽出された前記2つ以上の文字列をそれぞれ認識す
    る認識手段と、 この認識手段で認識された前記2つ以上の文字列により
    前記印刷物の有効性を判定する判定手段とを具備したこ
    とを特徴とする印刷物の検査装置。
JP19720992A 1992-07-23 1992-07-23 印刷物の検査装置 Expired - Lifetime JP3237906B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19720992A JP3237906B2 (ja) 1992-07-23 1992-07-23 印刷物の検査装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19720992A JP3237906B2 (ja) 1992-07-23 1992-07-23 印刷物の検査装置

Publications (2)

Publication Number Publication Date
JPH0644404A true JPH0644404A (ja) 1994-02-18
JP3237906B2 JP3237906B2 (ja) 2001-12-10

Family

ID=16370644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19720992A Expired - Lifetime JP3237906B2 (ja) 1992-07-23 1992-07-23 印刷物の検査装置

Country Status (1)

Country Link
JP (1) JP3237906B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007028362A (ja) * 2005-07-20 2007-02-01 Seiko Epson Corp 背景画像と目的画像が混在する画像データを処理するための装置及び方法
KR100742806B1 (ko) * 2002-08-06 2007-07-25 캐논 가부시끼가이샤 데이터 암호화 및 암호 해독을 포함한 인쇄 데이터 통신
US7778416B2 (en) 2002-08-06 2010-08-17 Canon Kabushiki Kaisha Print data communication with data encryption and decryption

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100742806B1 (ko) * 2002-08-06 2007-07-25 캐논 가부시끼가이샤 데이터 암호화 및 암호 해독을 포함한 인쇄 데이터 통신
US7778416B2 (en) 2002-08-06 2010-08-17 Canon Kabushiki Kaisha Print data communication with data encryption and decryption
JP2007028362A (ja) * 2005-07-20 2007-02-01 Seiko Epson Corp 背景画像と目的画像が混在する画像データを処理するための装置及び方法
US7760958B2 (en) 2005-07-20 2010-07-20 Seiko Epson Corporation Image processing apparatus and image processing method
US8045818B2 (en) 2005-07-20 2011-10-25 Seiko Epson Corporation Image processing apparatus and image processing method

Also Published As

Publication number Publication date
JP3237906B2 (ja) 2001-12-10

Similar Documents

Publication Publication Date Title
EP0807297B1 (en) Method and apparatus for separating foreground from background in images containing text
US6301386B1 (en) Methods and apparatus for gray image based text identification
JP3768052B2 (ja) カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体
US6160913A (en) Method and apparatus for digital halftone dots detection and removal in business documents
Alginahi Preprocessing techniques in character recognition
JP6080259B2 (ja) 文字切り出し装置及び文字切り出し方法
US20070253040A1 (en) Color scanning to enhance bitonal image
US11151402B2 (en) Method of character recognition in written document
CN114387591A (zh) 车牌识别方法、系统、设备及存储介质
JP2903923B2 (ja) 車番認識装置
CN115100077B (zh) 一种图像增强方法与装置
JPH09130614A (ja) 画像処理装置
EP1296283A2 (en) Half-tone dot elimination method and system thereof
CN111445402B (zh) 一种图像去噪方法及装置
JPH08305795A (ja) 文字認識方法
JPH0644404A (ja) 印刷物の検査装置
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
CN112465817B (zh) 一种基于方向滤波器的路面裂缝检测方法
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
CN117058805A (zh) 纸币图像处理方法及系统
JP3150762B2 (ja) グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式
JP4732626B2 (ja) 帳票処理方法および装置並びにプログラム
Demma et al. Automatic Ethiopian Vehicle Number Plate Detection System using MATLAB
Chaudhari et al. Document image binarization using threshold segmentation
JP2001291056A (ja) 文書画像認識装置及び記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081005

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081005

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091005

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101005

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111005

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111005

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121005

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121005

Year of fee payment: 11