JPH0644404A

JPH0644404A - 印刷物の検査装置

Info

Publication number: JPH0644404A
Application number: JP4197209A
Authority: JP
Inventors: Toshitake Hirasawa; 利勇平沢
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1992-07-23
Filing date: 1992-07-23
Publication date: 1994-02-18
Anticipated expiration: 2016-12-10
Also published as: JP3237906B2

Abstract

(57)【要約】【目的】文字部と背景部との濃度差が小さい場合におい
ても、文字列抽出のための２値化のしきい値を最適値に
設定でき、文字列のみを高い精度で抽出して高精度の検
査が可能となる印刷物の検査装置を提供する。【構成】スキャナ１２で印刷物上の画像データを読取
り、画像メモリ１６に格納する。画像メモリ１６内の濃
淡画像データにより、まず、印刷物の左上部の参照用文
字列を抽出して、その特徴量を算出し、抽出した参照用
文字列について文字認識を行なう。次に、文字抽出が困
難な右下部の文字列について、メモリ１９に格納した参
照用文字列の特微量を用いて抽出を行ない、文字認識を
行なう。こうして、文字と模様との反射明度が離れた文
字列と、反射明度が近い文字列の抽出および認識処理を
行なった後、それらの認識結果を互いに照合して、両同
一文字列が一致したときにのみ印刷物を有効であるとす
る有効性の判定を行なう。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、たとえば、２つの同じ
文字列画像を有する印刷物の有効性を検査する印刷物の
検査装置に関する。

【０００２】

【従来の技術】従来、模様の上に文字が印刷されている
印刷物における文字の印刷状態を検査する装置に関して
は、たとえば、特開平２−５６６８８号公報に示される
ように、印刷文字の濃淡画像データから濃度ヒストグラ
ムを作成し、その形状から適当なしきい値を決定し、２
値化処理を施した後、文字抽出を行なっていた。

【０００３】

【発明が解決しようとする課題】しかし、上記したよう
な従来の方法では、文字と模様との反射明度が近い場
合、濃度ヒストグラムにおけるそれぞれの濃度分布が分
離しておらず、文字を充分に抽出し得る２値化のしきい
値の決定が困難であり、そのため、高精度の検査が行え
ないという問題があった。

【０００４】そこで、本発明は、文字部と背景部との濃
度差が小さい場合においても、文字列抽出のための２値
化のしきい値を最適値に設定でき、文字列のみを高い精
度で抽出して高精度の検査が可能となる印刷物の検査装
置を提供することを目的とする。

【０００５】

【課題を解決するための手段】本発明の印刷物の検査装
置は、２つ以上の同じ文字列画像を有する印刷物から画
像データを収集する画像入力手段と、この画像入力手段
によって収集された画像データから、前記２つ以上の文
字列のち少なくとも１つの文字列を抽出するとともに、
その抽出した文字列の濃度的特徴量を求め、この求めた
濃度的特徴量に基づき、その他の文字列を抽出する画像
データ処理手段と、この画像データ処理手段によって抽
出された前記２つ以上の文字列をそれぞれ認識する認識
手段と、この認識手段で認識された前記２つ以上の文字
列により前記印刷物の有効性を判定する判定手段とを具
備している。

【０００６】

【作用】複数の同一文字列が複数箇所に印刷されている
印刷物において、文字部と背景部との濃度差が小さい箇
所に印刷されている文字列の抽出を行なう際、他の文字
部と背景部との濃度差が大きく抽出容易な箇所に印刷さ
れている文字列の抽出結果を用いて行なうことにより、
文字部と背景部との濃度差が小さい場合においても、文
字列抽出のための２値化のしきい値を最適値に設定して
文字列のみを高い精度で抽出できる。したがって、印刷
物の検査を高精度に行なうことが可能となる。

【０００７】

【実施例】以下、本発明の一実施例について図面を参照
して説明する。

【０００８】図１は、本実施例に係る印刷物の検査装置
の概略構成を示すものである。図において、１１は本装
置全体の制御および各種画像処理を行なうＣＰＵ（セン
トラル・プロセッシング・ユニット）であり、このＣＰ
Ｕ１１には、印刷物から画像データを収集するイメージ
スキャナ１２、ディスク装置１３、ディスプレイ装置１
４、動作の指示などを入力するキーボード１５、画像メ
モリ１６，１７，１８、参照用文字列における各文字の
特徴量を格納するメモリ１９、および、初期値や基準値
などを記憶するためのメモリ２０が接続されている。

【０００９】画像メモリ１６は、イメージスキャナ１２
により収集される原画像データを格納するものであり、
画像メモリ１７は、画像入力系の高周波ノイズの抑制処
理やエッジのコントラストを強調するためのフィルタリ
ング処理を施したデータを格納するものである。画像メ
モリ１８は、文字抽出に用いる２値画像データを格納す
るものである。メモリ１９は、２値化の際に用いる参照
用文字列に関する特徴量（詳細については後述）を格納
するものである。

【００１０】図２は、検査対象となる印刷物の一例を示
している。この印刷物３１には、たとえば、同一の文字
列が２箇所に印刷され、左上部に印刷された一方の文字
列３２ａは、文字と模様との反射明度の差が大きく（文
字部と背景部との濃度差が大きく）、一般的に文字抽出
し易い文字列であり、右下部に印刷された他方の文字列
３２ｂは、文字と模様との反射明度の差が小さく（文字
部と背景部との濃度差が小さく）、一般的に文字抽出し
難い文字列であると仮定する。

【００１１】次に、図２の印刷物３１を例にとって、図
３の印刷物検査の処理手順を示すフローチャートを参照
して本発明の検査方法を説明する。まず、イメージスキ
ャナ１２によって印刷物３１の画像データが読取られ、
収集された濃淡画像データ（以下、濃度が低いことは明
度が低いこととする）は画像メモリ１６に格納される
（Ｓ１）。

【００１２】画像データの収集が終了すると、まず、印
刷物３１の左上部の文字列３２ａを抽出して、その特徴
量を算出する（Ｓ２）。この算出された特微量はメモリ
１９に格納され、一方の文字列の文字抽出の参照データ
となる。ここで、ステップＳ２における参照用文字列の
抽出および特微量算出の方法について説明する。

【００１３】図４は、上記参照用文字列の抽出および特
微量算出を行なう際の処理手順の概略を示すフローチャ
ートである。まず、抽出しようとする文字列を含む大ま
かな領域（たとえば、ｉ×ｊ画素）を、キーボード１５
を用いて指定する（Ｓ８）。そして、画像メモリ１６内
の濃淡画像データに対し、上記指定領域内の画像データ
について濃度ヒストグラムを作成すると、一般に図５に
示すように、文字部および模様部を示す２つの山が現わ
れる。ここで、たとえば濃度ヒストグラムを解析するこ
とにより、２つの山（極大値）間でのヒストグラムの極
小値を与える濃度値ｔｍを求め（Ｓ９）、このｔｍによ
って濃淡画像データをしきい値処理することにより、左
上部の文字列３２ａを２値画像として抽出する（Ｓ１
０）。

【００１４】次に、抽出した２値化データについて、横
方向および縦方向にそれぞれ抽出画素で累積することに
より、図６に示すような周辺分布を求める（Ｓ１１）。
横方向に累積した周辺分布から、たとえば、「非０」分
布の範囲（つまり、文字画像に係る画素が１画素でも存
在する範囲）を文字領域の縦方向とし、また、同様に縦
方向に累積したときの分布から、たとえば、複数の「非
０」分布の範囲を各文字の横方向として、図７に示すよ
うに各文字の領域を検出して文字抽出を行なう（Ｓ１
２）。

【００１５】文字の抽出が終了すると、後の２値化処理
で用いる文字の特微量として、各文字における文字部の
画素数、および、それらの総和である文字列の全画素数
を計数し、それを文字の特徴量としてメモリ１９に格納
する（Ｓ１３）。

【００１６】このようにして、参照用文字列３２ａの抽
出、および、その文字の特微量（画素数）の算出を行な
うと、次に、抽出された参照用文字列３２ａの各文字に
ついて、辞書パターンとの比較処理を行なうことにより
文字の認識を行ない、その認識結果をメモリ２０に格納
する（Ｓ３）。

【００１７】参照用文字列３２ａの認識が終了すると、
次に、文字と模様との反射明度が近いために、文字抽出
が困難な右下部の文字列３２ｂについて、メモリ１９に
格納した左上部の参照用文字列３２ａの特微量を用いて
文字抽出を行なう（Ｓ４）。ここで、ステップＳ４にお
ける文字列の抽出方法について説明する。

【００１８】図８は、上記文字列の抽出を行なう際の処
理手順の概略を示すフローチャートである。まず、画像
メモリ１６に格納された濃淡画像データから、ステップ
Ｓ８と同様に、抽出しようとする文字列を含む大まかな
領域（たとえば、ｉ×ｊ画素）を、キーボード１５を用
いて指定する（Ｓ１４）。

【００１９】次に、上記指定された領域内の画像データ
に対してフィルタリング処理を行ない、その結果を画像
メモリ１７に格納する（Ｓ１５）。このフィルタリング
処理の一例は、たとえば、図１２に示すような３×３マ
スクの空間フィルタを用いた平滑化であり、図９に示す
ように、文字列の背景部に存在する高周波成分を含む斜
線などの繰返しパターンＰを除去するのに有効である。

【００２０】フィルタリング処理が終了すると、画像メ
モリ１６内の濃淡画像データのうち、上記指定領域内の
画像データについて濃度ヒストグラムを作成し、文字領
域を切出すためのしいき値を決定する。ところが、図１
１に示すように、右下部の文字列３２ｂは、文字と模様
との反射明度が近いため、濃度ヒストグラムが１つの山
になってしまう。そこで、文字列３２ａと文字列３２ｂ
の文字部全画素数がほぼ一致し、背景部に比べて文字部
の濃度が低いという前提で、先にメモリ１９に格納して
おいた文字列３２ａの文字部全画素数を用いて、ステッ
プＳ４で指定した全画素数（ｉ×ｊ）に対する文字列３
２ａの文字部全画素数の占める割合ｒ％を算出し、濃度
ヒストグラムの累積値の低い方からｒ％になる濃度値を
求める（Ｓ１６）。

【００２１】こうして求めた濃度値をしきい値として文
字列３２ｂの２値化を行ない、その結果を画像メモリ１
８に格納しておく（Ｓ１７）。この後、文字列３２ａの
２値画像から周辺分布および各文字領域を求めたステッ
プＳ１１，Ｓ１２と同様の手順で、画像メモリ１８に格
納した２値画像から図１０に示すような周辺分布を求め
（Ｓ１８）、各文字領域を検出する（Ｓ１９）。

【００２２】このとき、前記一様なしきい値により得ら
れる２値画像は、たとえば、図１３（ａ）に示すよう
に、文字「Ｍ」のようなかすれた文字を含んでしまう。
そこで、文字かすれをなくすべく、しきい値レベルを上
げると、図１３（ｂ）に示すように、文字「６８２」の
背景にノイズ成分Ｎが重なってしまう。すなわち、ステ
ップＳ１７のような全領域を一様なしきい値で２値化す
ることでは、充分な文字抽出ができない。したがって、
ステップＳ１５で格納したフィルタリング後の濃淡画像
データに対して、さらに細かい領域、たとえば、１文字
ごとにしきい値を再設定して文字抽出を行なう。

【００２３】すなわち、ステップＳ１６と同様に、メモ
リ１９に格納した文字列３２ａの各文字の画素数を用い
て、各文字領域の全画素数に対する各文字部画素数の占
める割合ｒ1,ｒ2,…ｒｎ％（ｎ＝文字数）を計算し、各
文字領域における濃度ヒストグラムの累積値が濃度の低
い方からｒ1,ｒ2,…ｒｎ％になる各濃度値を求める（Ｓ
２０）。これらの濃度値を各文字ごとのしきい値として
各文字領域ごとに２値化処理を行ない、その結果を画像
メモリ１８に格納して文字抽出を終了する（Ｓ２１）。

【００２４】このようにして、文字列３２ｂの抽出を行
なうと、次に、文字列３２ａと同様に、文字列３２ｂの
各文字について文字認識を行ない、その結果をメモリ２
０に格納する（Ｓ５）。

【００２５】以上のようにして、印刷物３１に印刷され
た文字と模様との反射明度が離れた文字列３２ａと、文
字と模様との反射明度が近い文字列３２ｂの抽出、およ
び、認識処理を行なった後、最後に２つの同一文字列３
２ａ，３２ｂに対する認識結果を互いに照合して（Ｓ
６）、たとえば、２つの同一文字列３２ａ，３２ｂの各
文字認識結果が全て一致したときにのみ、印刷物３１を
有効であるとするなどの、印刷物３１の有効性の判定を
行なう（Ｓ７）。

【００２６】このように、たとえば、同一文字列が２箇
所に印刷されていて、一方の文字列は文字と模様との反
射明度の差が大きく、他方の文字列は文字と模様との反
射明度の差が小さい印刷物において、文字と模様との反
射明度の差が小さい文字列を２値化して抽出する際、文
字と模様との反射明度の差が大きい文字列の２値化結果
を用い、各文字ごとの文字部画素数および文字部全画素
数を参照して２値化を行なうことにより、文字と模様と
の反射明度の差が小さい場合においても、文字列抽出の
ための２値化のしきい値を最適値に設定して文字列のみ
を高い精度で抽出できる。したがって、印刷物の有効性
検査などを高精度に行なうことが可能となる。

【００２７】なお、前記実施例では、文字と模様との反
射明度の差が大きい文字列、および、文字と模様との反
射明度の差が小さい文字列の、それぞれ１箇所ずつ同一
文字列が印刷された場合について説明したが、上記場合
に加えて、文字と模様との反射明度の差が小さい文字列
が複数個ある場合など、３つ以上の同一文字列が印刷さ
れていても、少なくとも１箇所に文字と模様との反射明
度の差が大きい文字列が印刷されていれば、本発明が適
応できる。

【００２８】また、前記実施例では、全画素数（ｉ×
ｊ）に対する文字列３２ａの文字部全画素数の占める割
合ｒ％、および、各文字領域の全画素数に対する各文字
部画素数の占める割合ｒ1,ｒ2,…ｒｎ％（ｎ＝文字数）
を用いているが、これらの割合ｒ％、および、ｒ1,ｒ2,
…ｒｎ％は、入力画像データおよび参照用文字列の２値
化レベルなどの条件によって変動させることもできる。

【００２９】また、前記実施例では、ある参照する文字
列を構成する、それぞれの文字の特徴情報として、文字
部の画素数（面積）、および、文字部の濃度が模様部よ
りも濃いことを用いているが、これに限らず、たとえ
ば、文字の周囲長、文字幅、重心、連結成分数などの幾
何学的特徴量、および、文字部の濃淡画像データの分散
などの濃度的特徴量を採用、および、組合わせて、２値
化しきい値の決定に用いることができる。

【００３０】さらに、前記実施例では、濃淡画像データ
を用いた場合について説明したが、カラー画像データの
入力を行ない、色を構成する、たとえばＲ，Ｇ，Ｂの画
像データを用いた場合においても、各種変換を行なった
結果を濃淡画像データとして扱い、前記列挙した特徴情
報を２値化しきい値の決定に用いることができる。

【００３１】

【発明の効果】以上詳述したように本発明によれば、文
字部と背景部との濃度差が小さい場合においても、文字
列抽出のための２値化のしきい値を最適値に設定でき、
文字列のみを高い精度で抽出して高精度の検査が可能と
なる印刷物の検査装置を提供できる。

【図面の簡単な説明】

【図１】本発明の一実施例に係る印刷物の検査装置の構
成を概略的に示すブロック図。

【図２】検査対象印刷物の一例を示す平面図。

【図３】印刷物検査の処理手順を示すフローチャート。

【図４】参照用文字列の抽出および特徴量算出の処理手
順を示すフローチャート。

【図５】参照用文字列の濃度ヒストグラムを示す図。

【図６】周辺分布の算出を説明する図。

【図７】文字領域の抽出を説明する図。

【図８】文字列抽出の処理手順を示すフローチャート。

【図９】フィルタリング処理の効果を説明する図。

【図１０】周辺分布の算出を説明する図。

【図１１】文字部の濃度ヒストグラムとしきい値との関
係を示す図。

【図１２】フィルタリング処理に用いる３×３マスクの
一例を示す図。

【図１３】文字の２値化例を示す図。

【符号の説明】

１１…ＣＰＵ、１２…イメージスキャナ、１６，１７，
１８…画像メモリ、１９，２０…メモリ、３１…印刷
物、３２ａ，３２ｂ…文字列。

Claims

【特許請求の範囲】

【請求項１】２つ以上の同じ文字列画像を有する印刷
物から画像データを収集する画像入力手段と、この画像入力手段によって収集された画像データから、
前記２つ以上の文字列のうち少なくとも１つの文字列を
抽出する第１文字列抽出手段と、この第１文字列抽出手段によって抽出された文字列の濃
度的特徴量を算出する濃度的特徴量算出手段と、この濃度的特徴量算出手段によって算出された濃度的特
徴量に基づき、その他の文字列を抽出する第２文字列抽
出手段と、前記第１文字列抽出手段および第２文字列抽出手段によ
って抽出された前記２つ以上の文字列をそれぞれ認識す
る認識手段と、この認識手段で認識された前記２つ以上の文字列により
前記印刷物の有効性を判定する判定手段とを具備したこ
とを特徴とする印刷物の検査装置。