JP4745296B2 - デジタル画像の領域分離方法および領域分離システム - Google Patents

デジタル画像の領域分離方法および領域分離システム Download PDF

Info

Publication number
JP4745296B2
JP4745296B2 JP2007159363A JP2007159363A JP4745296B2 JP 4745296 B2 JP4745296 B2 JP 4745296B2 JP 2007159363 A JP2007159363 A JP 2007159363A JP 2007159363 A JP2007159363 A JP 2007159363A JP 4745296 B2 JP4745296 B2 JP 4745296B2
Authority
JP
Japan
Prior art keywords
pixel
pixels
image
region
labeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007159363A
Other languages
English (en)
Other versions
JP2007336562A (ja
Inventor
ジョン キャンベル リチャード
豊久 松田
シャオ‐シェン チェン ローレンス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2007336562A publication Critical patent/JP2007336562A/ja
Application granted granted Critical
Publication of JP4745296B2 publication Critical patent/JP4745296B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/155Segmentation; Edge detection involving morphological operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20152Watershed segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

本発明は、デジタル画像におけるほぼ均一な色の領域を特定する方法およびシステムに関するものである。
多くのデジタル画像における視覚的品質を改善させるための処理は、デジタル画像の中の異なる画像領域を正確に特定できるかどうかに依存している。さらに、様々な画像領域の正確な検出は、多くの圧縮処理において重要である。
特許文献1には、以下のような技術が開示されている。まず、画像データをDCT変換して、特定のDCT係数について絶対値の和を求め、文字らしさを表す点数とする。この点数が所定の閾値より大きければ文字画像候補ブロックと判定し、そうでなければ、非文字画像ブロックと判定する。次に、連結された文字画像候補ブロックで構成される領域に対して、それを囲むブロックで構成される領域に着目し、この領域の各ブロックのAC(交流)成分がすべて小さければ、ブロック内が単一色であるとみなし、上記文字画像候補ブロックは文字であると判定する。文字画像候補ブロックの周辺のブロックが単一色であるか否かの判定を行う際、上記領域内の全画素に対するRGB値の分散を求めて閾値より小さいか否かにより判定するようにしても良い。
特開平9−186861(1997年7月15日公開)
しかしながら、特許文献1の技術では、画像データを周波数変換する必要があるので処理が複雑になるという問題がある。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、簡易な処理により領域分離ができる方法およびシステムを実現することにある。
本発明に係る方法は、上記課題を解決するために、デジタル画像の領域分離方法であって、デジタル画像に含まれる画素の中から少なくとも1つの画素を除去する除去処理を行い、残りの画素について、複数の画素値の頻度を求める第1ステップと、上記頻度のピークを示す画素値の少なくとも1つを特定する第2ステップと、上記第2ステップにおいて特定された上記画素値を画像ラベルと関連付けた関連情報を生成する第3ステップと、上記デジタル画像の中からラベル付けの対象となる候補画素位置を決定する第4ステップと、上記関連情報に基づいて、上記候補画素位置に画像ラベル付けを行う第5ステップとを含むことを特徴とする。
また、本発明に係るシステムは、デジタル画像の領域分離システムであって、デジタル画像に含まれる画素の中から少なくとも1つの画素を除去する除去処理を行い、残りの画素について、複数の画素値の頻度を求めるカウント手段と、上記頻度のピークを示す画素値の少なくとも1つを特定するピーク特定手段と、上記ピーク特定手段により特定された上記画素値を画像ラベルと関連付けた関連情報を生成する関連情報生成手段と、上記デジタル画像の中からラベル付けの対象となる候補画素位置を決定する第1決定手段と、上記関連情報に基づいて、上記候補画素位置に画像ラベル付けを行う第1ラベル付け手段とを備えることを特徴とする。
上記の構成によれば、デジタル画像に含まれる画素について、複数の画素値の頻度を算出する。そして、当該頻度のピークを示す画素値の少なくとも1つを特定する。ここで、下地領域や局所背景領域のような均一色の領域は、一般に面積が広い。そのため、当該領域の画素値の頻度が高くなり、ピークを形成する。よって、頻度のピークの画素値と画像ラベルとを関連付けた関連情報を参照することで、画像ラベルと関連付けられた画素値を有する画素の領域が均一色の領域であると判断することができる。
局所背景領域の場合、デジタル画像全体からみるとそれほど面積が大きくない場合もある。また、このような局所背景領域は、その中に文字等を含むことが多い。そこで、上記の構成では、デジタル画像の画素の少なくとも1つを除去する除去処理を行い、残りの画素について頻度を算出する。これにより、例えば、文字等の周辺領域以外を除去して頻度を算出することができる。その結果、局所背景領域のような均一色の領域についても精度よく特定することが可能となる。
そして、ピーク以外の領域の中から候補画素位置を決定し、当該候補画素位置についても関連情報に基づいてラベル付けを行うことにより、より広い領域について画像ラベル付けを行うことができる。そして、画像ラベルにより領域分離することができる。このように、周波数変換のような複雑な処理を行うことなく、容易に領域分離を行うことができる。
さらに、本発明の方法は、上記デジタル画像における、上記候補画素位置ではない不確定画素位置を決定する第6ステップと、複数の近傍画素のラベルに基づいて、上記不確定画素位置に画像ラベル付けを行う第7ステップとを含むことが好ましい。
また、本発明のシステムは、上記デジタル画像における、上記候補画素位置ではない不確定画素位置を決定する第2決定手段と、複数の近傍画素のラベルに基づいて、上記不確定画素位置に画像ラベル付けを行う第2ラベル付け手段とを備えることが好ましい。
上記の構成によれば、候補画素位置以外の画素についても、ラベル付けを行うことができる。この際、当該画素の近傍画素のラベルに基づいてラベル付けがされるため、ラベルの精度のよい。
さらに、本発明の方法において、上記第7ステップは、上記関連情報に基づいて、上記不確定画素位置に対するクラスラベルを割り当てるステップと、上記不確定画素位置の上記複数の近傍画素について、上記不確定画素位置の画素値に対応するクラスラベルと同じ画像ラベルの頻度を求めるステップと、上記複数の近傍画素について求めた上記頻度と閾値との比較に基づいて、上記不確定画素位置の画像ラベル付けを行うステップとを含んでもよい。
また、本発明のシステムにおいて、上記第2ラベル付け手段は、上記関連情報に基づいて、上記不確定画素位置に対するクラスラベルを割り当てるラベル決定手段と、上記不確定画素位置の上記複数の近傍画素について、上記不確定画素位置の画素値に対応するクラスラベルと同じ画像ラベルの頻度を求める算出手段と、上記複数の近傍画素について求めた上記頻度と閾値との比較に基づいて、上記不確定画素位置の画像ラベル付けを行う不確定画素ラベル付け手段とを備えてもよい。
上記の構成によれば、関連情報に基づいて割り当てたクラスラベルと同じ画像ラベルの近傍画素の数が閾値よりも多い場合に、当該クラスラベルを不確定画素位置の画像ラベルとすることができる。これにより、不確定画素位置のラベル付けを精度よく行うことができる。
さらに、本発明の方法は、上記関連情報を示すルックアップテーブルを生成する第8ステップを含むことが好ましい。
また、本発明のシステムは、上記関連情報を示すルックアップテーブルを生成する生成手段を備えることが好ましい。
上記の構成によれば、ルックアップテーブルを参照することで、画素へのラベリングを容易に行うことができる。
さらに、本発明の方法は、上記第1ステップにおいて、上記頻度を示すヒストグラムを生成することが好ましい。ヒストグラムを生成することにより、当該ヒストグラムに対する微分演算等により容易にピークを特定することができる。
さらに、上記ヒストグラムに対してスムージング処理を行ってもよい。ここで、スムージング処理とは、ノイズ等の僅かな変動を除去する処理である。当該処理をおこなうことで、ヒストグラムに対して微分演算等によりピークを特定する際の精度を高くすることができる。
さらに、本発明の方法は、上記第1ステップの上記除去処理において、文字領域の一部の画素を除去することが好ましい。
また、本発明のシステムの上記カウント手段は、上記除去処理において、文字領域の一部の画素を除去することが好ましい。
文字は、背景領域とは異なるものである。そのため、文字領域の一部の画素を除去することにより、これらの影響を除去することができ、均一色の領域の特定精度を向上させることができる。
さらに、本発明の方法は、上記第4ステップにおいて、均一性を示す特徴量、分散値、文字らしさを示す特徴量の少なくとも1つに基づいて上記候補画素位置を決定することが好ましい。
第1ステップで求めたピークの領域は、画素値が均一な領域である。上記の構成によれば、候補画素位置として、より均一な領域を選択することができる。その結果、関連情報に記された画像ラベルを付与できる画素の数を増やすことができる。その結果、より一層容易に領域分離することができる。
なお、上記画像ラベルは、局所背景領域を示すものである。
また、上記画素値は、例えば、輝度値−彩度(L−C)色空間における値である。
また、本発明の方法は、デジタル画像の各画素の位置についての領域を示すためのクラスマップにおけるラベル付けされていない画素に対するラベル付けの方法であって、上記クラスマップのスキャンを行う第1ステップと、上記スキャンにおいて、ラベル付けされていない画素を特定する第2ステップと、上記ラベル付けされていない画素について、所定の条件を満足する場合にスキャンカウント値を累積する第3ステップと、上記スキャンカウント値に基づいて、上記ラベル付けされていない画素に対するラベル付けを行う第4ステップとを含むことを特徴とする。
所定の条件とは、例えば、上記ラベル付けされていない画素について、ラベル付けされていない画素の複数の近傍画素のラベルを参照して、上記ラベル付けされていない画素のクラスのラベルと同じ画像ラベルの頻度を求め、上記複数の近傍画素について求めた上記頻度と閾値との比較を行うことであること、である。
上記の構成によれば、上記条件を満たす、すなわち、ラベル付けされていない画素の複数の近傍画素のラベルを参照して、上記ラベル付けされていない画素のクラスのラベルと同じ画像ラベルの頻度を求め、この頻度が閾値よりも大きくなるスキャン方向のカウント値に基づいて、ラベル付けされていない画素へのラベルを当該近傍画素と同じものにすることができる。これにより、ラベルを精度よく割り当てることができる。
なお、上記クラスマップのスキャンを複数回行い、それぞれスキャン方向が異なることが好ましい。これにより、異なるスキャン方向での上記所定の条件の判定を行うことができ、ラベル割り当ての精度を高くすることができる。
例えば、上記複数の近傍画素は、スキャン済みの4つの最隣接画素であればよい。この場合、4つの最隣接画素の組み合わせは、スキャン方向によって異なることとなる。その結果、上記所定の条件の判定を複数の最隣接画素の組合せについて行うことができ、ラベル割り当ての精度を高くすることができる。
本発明に係る方法は、デジタル画像に含まれる画素の中から少なくとも1つの画素を除去する除去処理を行い、残りの画素について、複数の画素値の頻度を求める第1ステップと、上記頻度のピークを示す画素値の少なくとも1つを特定する第2ステップと、上記第2ステップにおいて特定された上記画素値を画像ラベルと関連付けた関連情報を生成する第3ステップと、上記デジタル画像の中からラベル付けの対象となる候補画素位置を決定する第4ステップと、上記関連情報に基づいて、上記候補画素位置に画像ラベル付けを行う第5ステップとを含む。これにより、簡易な処理により領域分離を行うことができる。
本発明の実施形態は、図面を参照することでより理解されるであろう。図面では、同じ部材については同じ符号をつけている。
ここで、図に示されるように、本発明の構成は、様々な異なる形態に変形および設計されることができることが容易にわかるであろう。このように、以下に述べる、本発明の方法およびシステムの実施形態についてのより詳細な説明は、本発明の範囲を限定するものではなく、本発明の最良の形態を示したものにすぎない。
本発明の実施形態の構成は、ハードウェア、ファームウェアおよび/またはソフトウェアによって実現されてもよい。ここで述べる一実施形態はこれらの形態の1つについてのみ説明するものであり、本発明の範囲内において、これらの形態の何れかで構成を実現してもよいことは、当業者であれば理解される。
図1は、画像10の一例を示している。画像10は、文書が印刷される紙の色である第1の均一色の下地領域12と、第2の均一色を有する第1局所背景領域14と、第3の均一色を有する第2局所背景領域16と、第4の均一色を有する第3局所背景領域18とを含むいくつかの領域を備えた文書画像である。印刷およびスキャン処理の不完全さのために、均一色の画像領域(例えば、局所背景領域)を構成する画素の各々は、同一の画素値(カラー値)(color value)を有していない場合がある。均一色の画像領域では、画素のカラー値は、中央又はピークのカラー値を中心とした狭い分布(つまり、分散値が小さい)を形成する傾向にある。本発明の実施形態は、狭い分布のカラー値を有する画素を、画像領域において均一色を示しているクラスに属するものと設定する。
本発明の実施形態は、デジタル画像のほぼ均一な色の領域を特定するための方法およびシステムである。画像領域に関して「ほぼ均一な色の領域」(本願では、単に「均一な色の領域」または「均一色の領域」と言う場合もある)とは、(a)正確に1つの色からなる領域、(b)人間の目によって均一な色の領域として認識される、多数の色からなる領域、(c)デジタルノイズのレベルを含んでいるが、ほぼ1つの色である、もしくは、1つの色として認識される領域、(d)色空間における距離測定単位だけ近接した複数の色からなる領域である。もしくは、ほぼ均一な色を一般に使用される用語として伝える他の定義であってもよい。
本発明の実施形態は、画素からなるデジタル画像のカラー値の頻度を決定するステップを含む。なお、カラー値は、デジタル画像の画素と同じ色空間で示されてもよい。もしくは、色空間が異なっていてもよい。色空間の例としては、RGB、sRGB、Lab、YUV、YCrCb、LCなどが挙げられるが、これらに限定されるものではない。色空間が同じであろうとなかろうと、色空間の量子化が同じである必要はない。色空間の次元も同じでなくてもよい。
図2に示す本発明の実施形態は、デジタル画像22における選択画素のカラー値の頻度(出現度数)を求めるステップ(22)を含む色解析(color analysis)を行う。図2に示される本発明の実施形態は、さらに、カラー値の頻度におけるピーク領域、および、各ピーク領域に対応するカラー値を特定する(24)。そして、各ピーク領域に対応するカラー値と画像ラベルとを関連付けるステップ(26)を含む。
ここで、画像ラベルは、例えば、下地領域または局所背景領域を示す。なお、精度良くラベル付けする場合には、画像全体、あるいは、画像全体から、網点画素、エッジ画素を取り除いた画素についてヒストグラムを生成し、このヒストグラムの最大度数ピークを下地領域と判定すればよい。そして、この下地領域と各クラスのラベルの代表色(例えば平均値)を比較し、最も近い代表色を有するクラスを下地領域として、それ以外の領域を局所背景として扱うことが出来る。
さらに、デジタル画像において、ほぼ均一色である局所背景領域を特定するステップを含んでもよい。この場合、デジタル画像の絵柄領域(pictorial region)でのほぼ均一色の領域を対象とするのではなく、文字を取り囲む、ほぼ均一色の領域を対象とする。なお、絵柄領域とは、網点または連続階調で構成された写真領域のことである。この実施形態では、カラー値の頻度の決定は、文字を取り囲む画素(対象となる選択画素)のみを考慮して行われる。図3は、色解析の実行対象となる文字を取り囲む選択画素30を示す図である。その他、選択画素は、絵柄領域32の中の人物のエッジを取り囲む領域の画素であってもよい。
本発明の別の実施形態では、選択画素がセレクションマスク(選択マスク)によって特定される。図4は、セレクションマスク40を生成する構成を示す図である。セッションマスク40を生成するための構成には、デジタル画像45から求められた画像分離情報(画像分離信号)44,46に基づいたデジタル画像45のフィルタ処理を行うフィルタ部42を含む。なお、画像分離情報44,46は、デジタル画像45に対応する画像、例えば、異なる解像度のデジタル画像45のバージョン、から求められてもよい。画像分離情報44,46は、文字候補としてみなされる、デジタル画像45における文字44の一部の画素を示す情報を含む。また、画像分離情報は、デジタル画像45の画素に絵柄(網点または連続階調で構成された写真領域)と思われる領域46を示す情報を含んでもよい。フィルタ部42は、絵柄と思われる領域46と文字候補44とを結合して、デジタル画像45の絵柄領域に現れる文字候補を除去する処理を行う。フィルタ部42の出力結果41には、デジタル画像の非絵柄領域の文字の画素が残る。セレクションマスク40は、文字画素41に対する膨張部48による膨張処理の結果43から文字画素41を除去する論理演算によって求められる。図4に示される実施形態では、当該論理演算を行うブロックとして、膨張処理の結果43と文字画素41に対する否定演算部52の結果47との論理和演算部50を含む。また、他の論理的、数学的な処理、もしくは他の処理を行うブロックであってもよい。
例えば、膨張処理は、注目画素を中心とする9×9画素を参照し、近傍9×9画素において1つでも文字画素が存在すれば、注目画素を文字周辺画素とする。そして、文字周辺画素であり、かつ、文字画素でない画素を論理演算によって求める。
このように、セレクションマスク40は、文字らしさを示す画像分離情報44に基づいて生成される。そのほか、セレクションマスク40は、デジタル画像の所定マスク内の欣一性に基づいて生成されてもよい。均一性を示す指標としては、例えば、画像輝度値のエントロピーを用いることができる。画像データから、各画素、あるいは、ブロックについて所定マスク内の輝度値のヒストグラムを生成し、当該ヒストグラムより下記の式に従ってエントロピーを算出する。ただし、h(i)はヒストグラムを示し、Nはヒストグラムのビン数を示している。
輝度値のヒストグラムのエントロピーは、均一な領域において低い値をとり、不均一な領域において高い値をとる。そのため、例えば、均一性を示すエントロピーの値が所定閾値以下の画素を選択画素とするセレクションマスクを生成することができる。
また、セレクションマスク40は、注目画素を中心とする所定マスク内の画素値の分散値に基づいて生成されてもよい。分散値は、均一な領域において低い値をとり、不均一が領域において高い値をとる。そのため、例えば、分散値が所定閾値以下の画素を選択画素とするセレクションマスクを生成することができる。
さらに、セレクションマスク40は、均一性を示す特徴量(例えば、エントロピー)、分散値、文字らしさを示す特徴量の全てに基づいて、生成されてもよい。すなわち、エントロピーが所定閾値以下であり、分散値が所定閾値以下であり、文字らしさを示す特徴量が所定閾値以下である画素(エントロピーが小さく、分散値が小さく、かつ、文字画素ではない画素)を、選択画素とする。
また、例えば、文字エッジに対する膨張処理結果を除去するようなセレクションマスクを生成してもよい。膨張処理は、例えば、注目画素を中心とする3×3近傍画素を参照し、3×3近傍画素において1つでもエッジ画素が存在すれば注目画素エッジ画素として扱う。そして、このような条件を充たす画素を除去してもよい。なお、膨張処理の度合いは、エッジ検出精度に依存し、エッジ検知抜けが少ない場合、膨張する必要はない。一方、エッジ検知精度が悪く、エッジ検知抜けが多数発生するような場合には、ある程度膨張する必要がある。
また、別の実施形態では、デジタル画像のカラー値の頻度を求める処理には、ヒストグラムの生成処理が含まれていても良い。ヒストグラムは、各欄がカラー値に対応しているアレイ(マトリックスともいう)であってもよい。当該アレイへの入力値は、入力欄に対応するカラー値を有する、デジタル画像の中の選択画素の数の累積値を示している。図5は、2次元色空間(例えば、LC色空間)に対するヒストグラムアレイ55の一例を示す図である。LC色空間の例では、アレイの各欄の指標は、例えば、L(輝度値)56およびC(彩度)58を示している。
2次元ヒストグラムは、各欄の位置の上の高さが、当該欄に対応するカラー値を有する選択画素の数を示している3次元プロットであってもよい。図6は、2次元ヒストグラムの一例である3次元プロット60を示している。LC色空間の例では、プロットの軸は、例えば、L(輝度値)66およびC(彩度)68である。
本発明の別の実施形態では、カラー値の頻度におけるピーク領域と、各ピーク領域に対応するカラー値とを特定する処理に、頻度データのフィルタ処理が含まれている。当該フィルタ処理は、ノイズや網点線数の残差(residual)によるデータの僅かな変化を除去する際に、ピークの一般的な形状を維持するためのスムージング処理を備えていても良い。また、フィルタ処理は、各次元ごとに独立して実行されてもよい。さらに、フィルタ処理のサポートは、各次元ごとに異なっていてもよい。また、フィルターは、固定されていてもよいし、可変であってもよい。
ピーク領域の特定に、クラスタリング技術を用いても良い。もしくは、ピーク領域の特定に、統計処理を用いても良い。ピーク領域の特定に、ウォーターシェッド・アルゴリズム(流域アルゴリズム)を用いてもよい。ウォーターシェッド・アルゴリズムを用いた実施形態を図7に示す。また、ピーク領域の特定は、フィルタ処理および距離変換処理を用いても良い。この実施形態については図8に示す。
図7に示される形態では、ウォーターシェッド・アルゴリズム部72によるウォーターシェッド・アルゴリズムを用いた処理は、領域ラベリング(ラベル付け)部74によるラベリング処理の前に行われ、頻度の累積処理76によって示される複数のカラー分布の間の境界を分離するために使用される。
図8に示される形態では、微分演算部82が、ヒストグラム80、または、画像における選択画素のカラー値の頻度を示す他の形式のものに対して微分演算を実行する。また、当該微分演算部82は、微分フィルタを用いてヒストグラムデータ80のフィルタ処理を行う。微分フィルタは、頻度が「0」のビンから「0」でないビンへの遷移については大きな負の値を返す。ピークまたはピーク付近において、微分フィルタは、大きな正の値を返す。微分フィルタの一例は、カーネル(kernel)を有する3×3のラプラシアンフィルタである。
また、下記のようなラプラシアンフィルタであってもよい。
微分演算部82の出力81に対して、閾値処理部84は、当該出力81と閾値との比較を行う。閾値処理部84は、微分演算部81の処理結果が閾値以上であるヒストグラムのビンをピークシード83として特定する。閾値は、固定値であってもよいし、可変であってもよい。例えば、ヒストグラムの最大度数と所定の重み係数(例えば0.01)の乗算結果が可変閾値として用いることができる。ヒストグラムでのラベリング処理では、各ピークシード領域にラベルを生成することにより、ラベル付けされたピークシード領域85を生成する。ゼロビンラベル割り当て部88は、頻度「0」のヒストグラムのビンに、カラー値の頻度が0であることを示すクラスに対応する予備ラベルを割り当てる。そして、ゼロビンラベル割り当て部88は、頻度「0」のビンのカラー値と予備ラベルとを関連付けた関連情報を生成する。ピークシード領域としてラベル付けされておらず、頻度「0」ではないビンは、距離変換部87により、ピークシード領域としてラベル付けされる。距離変換部87は、距離変換に関してピークシード領域に最も近いビンに対して、当該ピークシード領域のラベル付けを行う。距離変換部87もまた、2以上のピーク領域を含むビンの隣接した領域を分離してもよい。
別の実施形態では、距離変換部87による距離変換処理は、2パススキャン方法を含んでいても良い。各パスにおいて、ヒストグラムの色空間における距離は、何もラベル付けがされておらず、頻度が「0」ではないビンから最も近いピーク領域までの距離である。また、最初のスキャンパスと2番目のスキャンパスとは、反対方向であってもよい。
ここで、距離変換処理は、距離ベースのクラスタリングであり、ラベリングされた画素に対して、最も距離の近いラベルに併合する処理である。ユークリッド距離(画素間の直線距離)変換に代表される画像分割アルゴリズムであり、距離としては、ユークリッド距離以外に、City block(市街地距離。注目画素に隣接する4近傍の画素をベースに画素間の距離を表すものであり、注目画素の第1近傍にある画素は1単位、第2近傍にある画素(対角の位置の画素)は2単位離れていると表す)などを用いることもできる。
上記図8で示したヒストグラムに対する解析処理の一実施例の手順について図16〜19を参照して詳細に説明する。なお、ここでは、距離変換処理として2パススキャン方法を用いた場合を例にとり説明する。
図16は、ヒストグラムに対する解析処理の手順を示すフロー図である。まず、上述したように、デジタル画像の中からセレクションマスク(選択マスク)に従って選択された選択画素のカラー値について、図5または図6のようなヒストグラムを生成する。
そして、生成したヒストグラムに対して、微分演算部82により微分フィルタを用いた微分演算が行われ、閾値処理部は、その結果と所定の閾値とを比較して、ピークシード領域を検出する(161)。具体的には、微分演算結果が所定閾値以上の領域をピークシード領域とする。図16において、情報165は、検出されたピークシード領域を示す情報である。
次に、検出したピークシード領域165について、ラベリング部86は、ピークごとに異なるラベルを付けるラベリング処理を行う(162)。図16において、情報166は、ラベリング処理の結果を示す情報であり、ラベルAが付けられた領域(図では、左下から右上方向の斜線部)とラベルBが付けられた領域(図では、左上から右下方向の斜線部)とを示している。
上記ラベリング処理と並行して、ゼロビンラベル割り当て部88は、ヒストグラムの中から頻度が「0」のビンを除外ビンとして特定する。そして、特定した除外ビンのカラー値以外のカラー値を有する画素を、ラベル付け候補画素として選択する(163)。なお、ここでは、頻度が「0」のビンを除外ビンとして特定するものとしたが、頻度が所定閾値以下のものを除外ビンとして特定してもよい。図16において、情報167は、選択されたラベル付け候補画素を示す情報である。
その後、情報166および情報167に基づいて、距離変換部87は、距離変換処理を行い、ラベル付け候補画素のうちのラベル未割り当ての画素の各々にラベル付けを行う(164)。
図17は、距離変換処理で用いる画素間距離の一例を示す図である。本実施例では、黒丸で記した画素171から当該画素171に隣接する画素までの距離を「1」として定義する。さらに、画素171から当該画素171に隣接する画素の外側に位置する画素までの距離を「2」、…として定義する。すなわち、ある特定画素との距離が「n」の画素の外側に位置する画素と特定画素との画素間距離を「n+1」と定義する。
図18は、距離変換処理の処理内容の概要を示す図である。距離変換処理では、ラベリングされているピークシード領域の画素に基づいて、ラベル付け候補画素のうちのラベル未割り当ての画素にラベル付けを行う。図18の左側において、グレーで示した画素は、ラベル付け候補画素のうちのラベル未割り当ての画素を示している。距離変換処理では、最近傍のピークシード領域のラベルを割り当てる。すなわち、図18において、ア)の矢印の先端部に位置するラベル未割り当ての画素については、最近傍のピークシード領域のラベルが「ラベルA」であるため、「ラベルA」を割り当てる。同様に、イ)の矢印の先端部に位置するラベル未割り当ての画素については、最近傍のピークシード領域のラベルが「ラベルB」であるため、「ラベルB」を割り当てる。同じく、ウ)の矢印の先端部に位置するラベル未割り当ての画素については、「ラベルA」のピークシード領域よりも「ラベルB」のピークシード領域の方が近いため、「ラベルB」を割り当てる。図18の右側は、全てのラベル付け候補画素にラベル付けされた結果を示している。
図18で示したようなラベル付けを行う詳細な手順について図19を参照しながら説明する。ここでは、左上から右下方向および右下から左上方向の2方向の2パススキャン法を用いている。各スキャンパスでは、注目画素の4近傍画素を参照してラベル付けを行う。
まず、左上から右下方向のスキャン(走査)を行う。この場合、図19の(a)に示したように、注目画素に隣接する画素のうちの、既にスキャンされている4近傍画素(注目画素の左上、上、右上、左の4画素)を参照しながら順次ラベルの割り当てを行う。このとき、以下の規則(a)〜(c)に従って、ラベルの割り当てを行う。
規則(a):4近傍画素の中にピークシード領域の画素が存在する場合、注目画素に対して、距離「1」が付加された、当該ピークシード領域のラベルを割り当てる。
規則(b):4近傍画素の中に、ピークシード領域の画素が存在せず、距離が付加されたラベルが割り当てられた画素が存在する場合、注目画素に対して、最小の距離「D」を有するラベルを割り当てるとともに、距離「D+1」を当該ラベルに付加する。
規則(c):4近傍画素の中に、ピークシード領域の画素、および、距離「D」が付加されたラベルが割り当てられた画素の両者が存在しない場合、注目画素に対してラベルの割り当てをおこなわず、次の注目画素のラベリング処理を行う。
図19の(b)は、ラベル付け候補画素のうちのラベル未割り当ての画素の各々に対して、左上から右下方向のスキャンによるラベルの割り当てを行った結果を示す図である。
次に、右下から左上方向のスキャン(走査)を行う。この場合、図19の(c)に示したように、注目画素に隣接する画素のうちの、既にスキャンされている4近傍画素(注目画素の右下、下、左下、右の4画素)を参照しながら順次ラベルの割り当てを行う。このときのラベルの割り当て方法は、左上から右下方向のスキャンのときの同じである。すなわち、規則(a)〜(c)に従う。ただし、一回目のスキャン(左上から右下方向)と異なるラベルを割り当てようとする場合、1回目のスキャンの際に割り当てたラベルの距離と、2回目のスキャンの際に割り当てようとするラベルの距離とを比較する。当該距離が同じである場合、もしくは、1回目の距離が2回目の距離よりも短い場合、一回目のスキャンの際に割り当てたラベルを採用し、ラベルの更新を行わない。一方、2回目の距離が1回目の距離よりも短い場合、2回目のスキャンの際に割り当てたラベルにより更新を行う。
図19(d)は、ラベル付け候補画素のうちのラベル未割り当ての画素の各々に対して、2回のスキャンによるラベルの割り当てを行った結果を示す図である。
このようにして、ラベル付け候補画素の各画素に対してラベルの割り当てを行うことができる。
頻度データにおけるラベル付けされた領域から、カラー値と画像領域との間の関連付けを行う。カラー値と画像領域との間の関連付けは、カラールックアップテーブルの形式であってもよい。カラールックアップテーブルは、カラー値が示される色空間の次元に対応する欄を備えていればよく、カラールックアップテーブルでの特定の欄のエントリは、画像領域ラベルに対応している。
図9に示されるように、本発明の一実施形態は、(a)2次元ヒストグラム91の生成処理を行う2Dヒストグラム生成部90、(b)2次元ヒストグラム91のスムージング処理92を行うことにより、ヒストグラムにおいてピークの一般的な形状が、小さな度数を有するビンを除去したとしても保たれるスムージング処理されたヒストグラム93の生成処理を行うスムージングフィルタ適用部92、(c)スムージング処理された2次元ヒストグラム93を解析し、当該ヒストグラム93においてピークに寄与するカラー値を特定する処理を行う2Dヒストグラム解析部94、および、(d)カラー値が画像領域ラベルに対応付けられているカラールックアップテーブル97を生成するカラールックアップテーブル生成部96を備える。
2次元ヒストグラム91は、輝度値および彩度(LC値)のカラー値の組み合わせごとに画素数を累積することによって形成される。この場合、2次元ヒストグラム91は、LCヒストグラムとして示される。そして、例えば、Lは128レベルに量子化され、Cは64レベルに量子化される。
画像の中の全ての画素がLCヒストグラム91に寄与しなくてもよい。例えば、画像の非絵柄領域中の文字候補画素の周りの画素だけ、LCヒストグラムに寄与してもよい。
LCヒストグラムは、各次元について、1次元スムージングフィルタを用いてスムージングされる。L次元において、スムージングフィルタは、5×1フィルタであってもよい。5×1のスムージングフィルタの一例は、[1 4 6 4 1]である。C次元において、スムージングフィルタは、3×1フィルタであってもよい。3×1のスムージングフィルタの一例は、[1 2 1]である。
別の実施形態では、デジタル画像において局所背景領域が検知されてもよい。図10は、本発明の一実施形態を示すものである。図10に示されるように、セレクションマスク生成部102は、デジタル画像100と、関連する文字検知結果101とを結合し(combine)、セレクションマスク103を生成する。
例えば、セレクションマスク生成部102は、文字画素に対して膨張処理を適用した処理結果から文字画素を取り除くことにより、文字周辺画素を抽出する。そして、セレクションマスク生成部102は、文字周辺画素であり、かつ、均一な領域であると判定された画素をセレクションマスクとして用いる。
膨張処理として、例えば、注目画素を中心とする9×9画素を参照し、近傍9×9画素において1つでも文字画素が存在すれば、注目画素を文字周辺画素とする。そして、文字周辺画素であり、かつ、文字画素でない画素を論理演算によって求める。
ヒストグラム生成部104は、セレクションマスク103によって特定されたデジタル画像100の画素の画素値だけを累積することにより、マスクされたヒストグラム105を生成する。当該マスクされたヒストグラム105は、ヒストグラム解析部106により、ピーク領域107を選択するために解析される。そして、LUT生成部108は、当該ピーク領域107を用いて、画素値が領域識別子と関連付けられているルックアップテーブル(LUT)109を生成する。LUT109は、LUT適用部110により、領域のラベリング処理111の対象となるデジタル画像100に適用される。ピーク領域107は、ほぼ均一な色の領域および局所背景に対応している。
別の実施形態では、LUTが、確定画素として示される局所背景候補画素にだけ適用されてもよい。図11は、デジタル画像100およびサポート情報113に基づいて候補マスク115を生成する候補マスク生成部114を備えた実施形態を示している。例えば、サポート情報113が文字検知結果を含み、候補マスク生成部114は、非文字画素のみを含む候補マスク115を生成する。この場合、LUT適用部112は、LUTを非文字画素にだけ選択的に適用する。または、サポート情報113が均一性を含み、候補マスク生成部114は、デジタル画像100のどの画素が当該均一性に基づいた背景画素であるのか示す候補マスク115を生成してもよい。LUT適用部112は、候補マスク115によって示される候補画素のみに対して選択的に上記LUT109を適用し、デジタル画像100の背景領域のラベリング116を生成する。LUT109は、デジタル画像100と、関連する文字検知結果101とがセレクションマスク103を生成するために結合される実施形態(図10参照)において、生成されるものであってもよい。また、セレクションマスク103によって特定されるデジタル画像の中の画素の画素値のみが累積される、マスクされたヒストグラム105が生成されてもよい。当該マスクされたヒストグラムを解析することにより、画素値が領域識別子と関連付けられているルックアップテーブル(LUT)109を生成するために使用されるピーク領域を選択する。
図11に示す実施形態では、均一性の情報は、局所ウィンドウにおける輝度値の分散に関連している。当該分散が小さい場合、画素値はほぼ均一である。当該分散が高い場合、画素値が均一ではない。別の実施形態では、局所ウィンドウにおけるカラー分散は均一性情報としてみなされる。また、デジタル画像100は、均一性情報を抽出するより前にスムージングされてもよい。
上述したように、サポート情報としては、均一性、文字らしさを示す文字検知結果がある。この他に、分散値であってもよい。均一性を示す特徴量としては、例えば、画像輝度値のエントロピーを用いることができる。画像データから、各画素、あるいは、ブロックについて所定マスク内の輝度値のヒストグラムを生成し、当該ヒストグラムより下記の式に従ってエントロピーを算出する。ただし、h(i)はヒストグラムを示し、Nはヒストグラムのビン数を示している。
輝度値のヒストグラムのエントロピーは、均一な領域において低い値をとり、不均一な領域において高い値をとる。そのため、例えば、候補マスク生成部114は、均一性を示すエントロピーの値が所定閾値以下の画素を候補画素とする候補マスクを生成することができる。
また、サポート情報が文字検知結果(文字らしさを示す特徴量)である場合、当該文字検知結果は、領域分離処理により得られるものである。当該領域分離処理としては様々な方法が知られており、いずれの方法を用いてもよい。そして、候補マスク生成部114は、文字領域として検知された領域を除いた画素を候補画素とする候補マスクを生成することができる。
また、サポート情報が分散値である場合について説明する。当該分散値は、注目画素を中心とする所定マスク内の画素値の分散値である。分散値は、均一な領域において低い値をとり、不均一が領域において高い値をとる。そのため、例えば、候補マスク生成部114は、分散値が所定閾値以下の画素を候補画素とする候補マスクを生成することができる。
さらに、候補マスク生成部114は、均一性を示す特徴量(例えば、エントロピー)、分散値、文字らしさを示す特徴量の全てに基づいて、候補マスクを生成してもよい。すなわち、エントロピーが所定閾値以下であり、分散値が所定閾値以下であり、文字らしさを示す特徴量が所定閾値以下である画素(エントロピーが小さく、分散値が小さく、かつ、文字画素ではない画素)を、候補画素とする。
図12に示す本発明の実施形態では、候補マスク生成部114によって生成されたデジタル画像100における候補マスクによって候補画素として特定されていない画素に背景ラベル116を広げる。候補マスク生成部114によって候補画素(確定画素)115として特定された画素にLUT109を選択的に適用した後、ラベル拡張部122は、ラベル付けされた画素を増やすことにより、新たなクラスマップ121を生成する。ラベル付けされた画素を増やす処理の前の分類マップ116はシードとしてみなされる。ラベル拡張部122は、隣接画素の接続性に基づいて分類ラベルを当該シードから広げる。図13は、4つの隣接画素の接続性に基づいてラベル付けを広げる手順を示している。
図13に示す実施形態では、注目画素が不確定な画素であるか否かを決定するために、クラスマップ上の各画素位置が調査される。ここで、不確定な画素とは、候補マスク生成の処理114によって候補画素として特定されていない画素のことである。すなわち、図示しない第2決定手段が不確定な画素を決定する。決定方法は、候補マスクに基づいて決定すればよい。注目画素が不確定な画素ではない場合、次の画素が調査される(138)。注目画素が不確定な画素である場合、次に、ラベル拡張部122のラベル決定手段は、近傍画素のクラスを調査する(132)。不確定な注目画素のクラスは、LUT(関連情報)に基づいて割り当てられる場合、近傍画素のクラスと比較される。そして、ラベル拡張部122の算出手段は、不確定な注目画素と同じクラスの近傍画素の数をカウントする(132)。そして、ラベル拡張部122の不確定画素ラベル付け手段は、当該カウント数が閾値よりも大きい場合、注目画素のクラスを、LUTに基づいて割り当てられるクラスに設定する。そして次の画素の調査が行われる(138)。カウント数が閾値以下である場合、注目画素のクラスは何も割り当てられないまま、次の画素の調査が行われる(138)。閾値は、例えば、調査された近傍画素の数の過半数の値である。
本発明の一実施形態では、例えば、4つの近傍画素が調査される。図14(a)に示されるように、4つの画素は、例えば、最隣接画素である。図14(a)において、注目画素は画素140であり、4つの最隣接画素は、141,142,143及び144である。その他、図14(b)〜(e)に示されるように、4つの近傍画素は、所定のスキャン方向で既にスキャンされた最隣接画素であってもよい。図14(b)では、スキャン方向が左上から右下であり、注目画素140に対する4つの近傍画素が145・146・147・148である。図14(c)では、スキャン方向が右下から左上であり、注目画素140に対する4つの近傍画素が149・150・151・152である。図14(d)では、スキャン方向が左下から右上であり、注目画素140に対する4つの近傍画素が153・154・155・156である。図14(e)では、スキャン方向が右上から左下であり、注目画素140に対する4つの近傍画素が157・158・159・160である。4つの近傍画素が調査される場合、閾値は3または4である。
ラベル付けは、1回のスキャンのみで行われても良いし、異なる方向への複数のスキャンによって行われても良い。
検知された局所背景領域は、背景領域に割り当てられている画素によって囲まれる、何もラベルが割り当てられていない不確定な画素を含む。これは、背景領域の中の文字に起因している。画像処理、圧縮処理または領域の他の処理の前に、これらの何も割り当てられていない画素に領域ラベルを割り当てることが望ましい。不確定な画素は、クラスマップの複数回のスキャンの後に割り当てられても良い。例えば、データに対して4回のスキャンが行われる。4回のスキャンは、ぞれぞれ、図14(b)〜14(e)で示されるように、右上から左下方向、左上から右下方向、左下から右上方向、右下から左上方向である。
図15に示されるように、クラスマップを画素ごとに複数回スキャンする形態であってもよい。まず、初期設定された特定のスキャン方向のスキャンを開始する(150)。当該スキャンにおいて、クラスマップの全ての画素が調査されたかどうかが判断される。注目画素が調査されていない場合(153)、次に、当該注目画素が不確定な画素であるか否かが判断される(154)。全ての画素について調査が終わっている場合(157)、全ての回数のスキャンが完了したか否かが判断される(164)。全ての回数のスキャンが完了していない場合(159)、次のスキャン方向のスキャンを開始する(150)。全ての回数のスキャンが完了した場合(161)、クラスマップの中の不確定な画素が更新される(166)。不確定な画素とは、前述したように、背景候補であるとみなされない画素である。
注目画素が不確定な画素ではない場合、当該注目画素に対する更なる処理は行われず、クラスマップの次の画素が調査される(155)。注目画素が不確定な画素である場合(163)、既にスキャンされている、当該注目画素の近傍画素が局所背景領域に属するか否かが判断される(156)。既にスキャンされている近傍画素の全てが局所背景領域に属する場合(165)、当該注目画素は、局所背景クラスに分類される(158)。そして、当該注目画素に対するスキャン方向のカウント数が増やされる(162)。その後、未調査の画素が残っている場合、次の画素が調査される(155)。既にスキャンされている近傍画素の全てが局所背景領域に属さない場合(165)、当該注目画素は、局所絵柄クラスに分類される(167)。その後、未調査の画素について調査される(155)。
クラスマップが複数のスキャン方向でスキャンされた後(161)、不確定な画素が更新される(166)。不確定な画素として分類された画素は、当該画素に対するスキャン方向のカウント数が閾値よりも大きい場合に、局所背景クラスに割り当てられる。当該閾値は、スキャン回数の過半数が設定される。もしくは、当該閾値は、全スキャン回数と同じ値に設定されてもよい。閾値は、クラスマップの全ての位置において一定であってもよいし、画素位置によって可変であってもよい。不確定な画素が局所背景に更新されると、デジタル画像の画素の画素値が調査される。当該画素値がLUTにおいて局所背景クラスに属する場合、当該クラスが当該画素に割り当てられる。LUTにおける局所背景クラスに属さない場合、不確定な画素は、不確定な局所背景クラスとしてみなされるクラスに割り当てられる。
頻度が「0」のヒストグラムのビンに対応するカラー値が、予備クラスのラベルと関連付けられる。当該予備クラスのラベルとは、このようなカラー値の1つの画素が、絵柄領域の候補、または、局所背景領域と見なされない均一色の領域の候補であることを示している。局所背景と見なされない均一色の領域は、文字を有しない均一色の領域である。対応するLUTのエントリは、絵柄候補ラベルまたは均一領域ラベルと関連付けられる。所定閾値よりも小さいカウント数を有するビンは、頻度が「0」のビンとして扱われる。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
最後に、図4,7,8,9,10,11,12に示した各部は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
すなわち、本発明に係る画像処理のシステムは、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである上記画像処理のシステムの制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、当該システムに供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、本発明に係る画像処理のシステムを通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は、プリンタ、FAX受信機、複合機などの画像処理装置にも適用できる。
図1は、下地領域および3つの局所背景領域を含むデジタル画像の一例を示す図である。 図2は、本発明の一実施形態に係る、デジタル画像における選択画素の頻度の算出処理を示す図である。 図3は、文字領域および絵柄のなかの変化領域を囲む選択画素を含むデジタル画像の一例を示す図である。 図4は、セレクションマスク(選択マスク)を生成する構成を示す図である。 図5は、アレイ形式の2次元ヒストグラムである。 図6は、3次元プロット形式の2次元ヒストグラムである。 図7は、ウォーターシェッド・アルゴリズム(流域アルゴリズム)を行う本発明の一実施形態を示す図である。 図8は、距離変換処理を行う本発明の一実施形態を示す図である。 図9は、ルックアップテーブルの生成処理を行う本発明の一実施形態を示す図である。 図10は、ルックアップテーブルの適用処理を含む本発明の一実施形態を示す図である。 図11は、ルックアップテーブルを選択的に適用する処理を含む本発明の一実施形態を示す図である。 図12は、領域ラベルの拡張処理を行う本発明の一実施形態を示す図である。 図13は、本発明の一実施形態に係る、領域ラベルの伝達のための方法を示す図である。 注目画素と当該注目画素の最隣接の4つの画素とを示す図であり、(a)は上下左右の近傍画素を示し、(b)は左上から右下へのスキャン方向で前もってスキャンされた近傍画素を示し、(c)は右下から左上へのスキャン方向で前もってスキャンされた近隣画素を示し、(d)は左下から右上へのスキャン方向で前もってスキャンされた近隣画素を示し、(e)は、右上から左下へのスキャン方向で前もってスキャンされた近隣画素を示している。 図15は、本発明の一実施形態に係る、不確定な注目画素へのラベルの割り当てを示す図である。 ヒストグラムに対する解析処理の手順を示すフロー図である。 距離変換処理で用いる画素間距離の一例を示す図である。 距離変換処理の処理内容の概要を示す図である。 距離変換処理の処理内容の詳細を示す図である。
符号の説明
72 ウォーターシェッド・アルゴリズム部(ピーク特定手段)
74 領域ラベリング部(関連情報生成手段)
82 微分演算部(ピーク特定手段)
84 閾値処理部(ピーク特定手段)
86 ラベリング部(関連情報生成手段、ルックアップテーブルの生成手段)
87 距離変換部
90 2Dヒストグラム生成部(カウント手段)
91 2Dヒストグラム
92 スムージングフィルタ適用部(カウント手段)
94 2Dヒストグラム解析部(ピーク特定手段)
96 ルックアップテーブル生成部(生成手段)
104 ヒストグラム生成部(カウント手段)
106 ヒストグラム解析部(ピーク特定手段)
108 LUT生成部(生成手段)
110・112 LUT適用部(第1ラベル付け手段)
114 候補マスク生成部(第1決定手段)
122 ラベル拡張部(第2ラベル付け手段)

Claims (14)

  1. デジタル画像の領域分離方法であって、
    デジタル画像に含まれる画素の中から網点画素およびエッジ画素を除去する除去処理を行い、残りの画素について、複数の画素値の頻度を求める第1ステップと、
    上記頻度のピーク領域の画素値の少なくとも1つを特定する第2ステップと、
    上記第2ステップにおいて特定された上記画素値を、下地領域または局所背景領域を示す画像ラベルと関連付けた関連情報を生成する第3ステップと、
    上記デジタル画像の中からラベル付けの対象となる候補画素位置を決定する第4ステップと、
    上記関連情報に基づいて、上記候補画素位置に画像ラベル付けを行う第5ステップとを含み、
    上記第5ステップでは、
    上記候補画素位置のうち、画素値の代表値が、上記第2ステップにおいて特定された上記画素値のうちの最大ピークの画素値に最も近い候補画素位置に対して、下地領域を示す画像ラベルのラベル付けを行い、それ以外の上記候補画素位置のうち、画素が文字領域を取り囲んでいる候補画素位置に対して、局所背景領域を示す画像ラベルのラベル付けを行うことを特徴とする領域分離方法。
  2. 上記デジタル画像における、上記候補画素位置ではない不確定画素位置を決定する第6ステップと、
    複数の近傍画素のラベルに基づいて、上記不確定画素位置に画像ラベル付けを行う第7ステップとを含むことを特徴とする請求項1に記載の領域分離方法。
  3. 上記第7ステップは、
    上記関連情報に基づいて、上記不確定画素位置に対するクラスラベルを割り当てるステップと、
    上記不確定画素位置の上記複数の近傍画素について、上記不確定画素位置の画素値に対応するクラスラベルと同じ画像ラベルの頻度を求めるステップと、
    上記複数の近傍画素について求めた上記頻度と閾値との比較に基づいて、上記不確定画素位置の画像ラベル付けを行うステップとを含むことを特徴とする請求項2に記載の領域分離方法。
  4. 上記関連情報を示すルックアップテーブルを生成する第8ステップを含むことを特徴とする請求項1に記載の領域分離方法。
  5. 上記第1ステップにおいて、上記頻度を示すヒストグラムを生成することを特徴とする請求項1に記載の領域分離方法。
  6. 上記ヒストグラムに対してスムージング処理を行うことを特徴とする請求項5に記載の領域分離方法。
  7. 上記第1ステップの上記除去処理において、文字領域の一部の画素を除去することを特徴とする請求項1に記載の領域分離方法。
  8. 上記第4ステップにおいて、均一性を示す特徴量、分散値、文字らしさを示す特徴量の少なくとも1つに基づいて上記候補画素位置を決定することを特徴とする請求項1に記載の領域分離方法。
  9. デジタル画像の領域分離システムであって、
    デジタル画像に含まれる画素の中から網点画素およびエッジ画素を除去する除去処理を行い、残りの画素について、複数の画素値の頻度を求めるカウント手段と、
    上記頻度のピーク領域の画素値の少なくとも1つを特定するピーク特定手段と、
    上記ピーク特定手段により特定された上記画素値を、下地領域または局所背景領域を示す画像ラベルと関連付けた関連情報を生成する関連情報生成手段と、
    上記デジタル画像の中からラベル付けの対象となる候補画素位置を決定する第1決定手段と、
    上記関連情報に基づいて、上記候補画素位置に画像ラベル付けを行う第1ラベル付け手段とを備え
    上記第1ラベル付け手段は、
    上記候補画素位置のうち、画素値の代表値が、上記ピーク特定手段において特定された上記画素値のうちの最大ピークの画素値に最も近い候補画素位置に対して、下地領域を示す画像ラベルのラベル付けを行い、それ以外の上記候補画素位置のうち、画素が文字領域を取り囲んでいる候補画素位置に対して、局所背景領域を示す画像ラベルのラベル付けを行うことを特徴とする領域分離システム。
  10. 上記デジタル画像における、上記候補画素位置ではない不確定画素位置を決定する第2決定手段と、
    複数の近傍画素のラベルに基づいて、上記不確定画素位置に画像ラベル付けを行う第2ラベル付け手段とを備えることを特徴とする請求項に記載の領域分離システム。
  11. 上記第2ラベル付け手段は、
    上記関連情報に基づいて、上記不確定画素位置に対するクラスラベルを割り当てるラベル決定手段と、
    上記不確定画素位置の上記複数の近傍画素について、上記不確定画素位置の画素値に対応するクラスラベルと同じ画像ラベルの頻度を求める算出手段と、
    上記複数の近傍画素について求めた上記頻度と閾値との比較に基づいて、上記不確定画素位置の画像ラベル付けを行う不確定画素ラベル付け手段とを備えることを特徴とする請求項10に記載の領域分離システム。
  12. 上記関連情報を示すルックアップテーブルを生成する生成手段を備えることを特徴とする請求項に記載の領域分離システム。
  13. 上記カウント手段は、上記除去処理において、文字領域の一部の画素を除去することを特徴とする請求項に記載の領域分離システム。
  14. 上記画素値は、輝度値−彩度(L−C)色空間における値であることを特徴とする請求項に記載の領域分離システム。
JP2007159363A 2006-06-15 2007-06-15 デジタル画像の領域分離方法および領域分離システム Active JP4745296B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/424,297 US7864365B2 (en) 2006-06-15 2006-06-15 Methods and systems for segmenting a digital image into regions
US11/424,297 2006-06-15

Publications (2)

Publication Number Publication Date
JP2007336562A JP2007336562A (ja) 2007-12-27
JP4745296B2 true JP4745296B2 (ja) 2011-08-10

Family

ID=38861222

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007159363A Active JP4745296B2 (ja) 2006-06-15 2007-06-15 デジタル画像の領域分離方法および領域分離システム

Country Status (2)

Country Link
US (2) US7864365B2 (ja)
JP (1) JP4745296B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8270709B2 (en) * 2006-08-31 2012-09-18 Corel Corporation Color selection and/or matching in a color image
US7801358B2 (en) * 2006-11-03 2010-09-21 Google Inc. Methods and systems for analyzing data in media material having layout
JP2008271365A (ja) * 2007-04-24 2008-11-06 Murata Mach Ltd 画像処理装置及び画像処理方法
US7940985B2 (en) * 2007-06-06 2011-05-10 Microsoft Corporation Salient object detection
US20090033671A1 (en) * 2007-08-02 2009-02-05 Ati Technologies Ulc Multi-sample rendering of 2d vector images
US8160396B2 (en) * 2007-12-06 2012-04-17 Mitsubishi Electric Research Laboratories, Inc. Method and apparatus for touching-up images
US8179363B2 (en) * 2007-12-26 2012-05-15 Sharp Laboratories Of America, Inc. Methods and systems for display source light management with histogram manipulation
US9083519B2 (en) * 2008-02-29 2015-07-14 Sharp Laboratories Of America, Inc. Systems and methods for adaptively selecting a decoding scheme to decode embedded information
US9047674B2 (en) * 2009-11-03 2015-06-02 Samsung Electronics Co., Ltd. Structured grids and graph traversal for image processing
US9531906B2 (en) * 2010-06-11 2016-12-27 Xerox Corporation Method for automatic conversion of paper records to digital form
CN102455628B (zh) * 2010-10-29 2014-08-13 京瓷办公信息系统株式会社 图像形成装置
US9223769B2 (en) 2011-09-21 2015-12-29 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
CN103106668B (zh) * 2011-11-09 2016-08-03 佳能株式会社 基于颜色直方图来描述图像区域的方法和系统
ES2687674T3 (es) 2012-02-01 2018-10-26 Fabrica Nacional De Moneda Y Timbre - Real Casa De La Moneda Método de securización para securizar la descripción de un objeto
JP5939154B2 (ja) * 2012-12-27 2016-06-22 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
US9058539B2 (en) 2013-04-16 2015-06-16 Canon Kabushiki Kaisha Systems and methods for quantifying graphics or text in an image
US20150089446A1 (en) * 2013-09-24 2015-03-26 Google Inc. Providing control points in images
JP6438774B2 (ja) * 2015-01-19 2018-12-19 株式会社メガチップス 判定装置及び制御プログラム並びに判定方法
US9842410B2 (en) * 2015-06-18 2017-12-12 Samsung Electronics Co., Ltd. Image compression and decompression with noise separation
CN108305270B (zh) * 2018-03-19 2022-11-01 河南工业大学 一种基于手机拍照的仓储粮虫计数系统及方法
RU2718429C1 (ru) * 2019-12-13 2020-04-02 федеральное государственное бюджетное образовательное учреждение высшего образования "Донской государственный технический университет" (ДГТУ) Устройство обнаружения локально-стационарных областей на изображении

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06152945A (ja) * 1992-11-06 1994-05-31 Canon Inc 画像処理装置
JPH09251533A (ja) * 1996-03-18 1997-09-22 Babcock Hitachi Kk 画像領域の抽出方法
JP2003303346A (ja) * 2002-04-09 2003-10-24 Nippon Telegr & Teleph Corp <Ntt> 目標追跡方法、目標追跡装置、目標追跡プログラム、並びにこのプログラムを記録した記録媒体
JP2005159576A (ja) * 2003-11-21 2005-06-16 Sharp Corp 画像処理方法及び画像処理装置並びに画像形成装置、プログラム、記録媒体
JP2005353101A (ja) * 2005-08-25 2005-12-22 Ricoh Co Ltd 画像特徴抽出方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Family Cites Families (154)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH646788A5 (de) * 1978-11-28 1984-12-14 Hell Rudolf Dr Ing Gmbh Verfahren und schaltungsanordnung zum erkennen von farben.
US4741046A (en) * 1984-07-27 1988-04-26 Konishiroku Photo Industry Co., Ltd. Method of discriminating pictures
US4805023A (en) * 1985-10-15 1989-02-14 Texas Instruments Incorporated Programmable CCD imager defect compensator
US5001767A (en) * 1987-11-30 1991-03-19 Kabushiki Kaisha Toshiba Image processing device
JPH02100583A (ja) * 1988-10-07 1990-04-12 Toshiba Corp 画像処理方法およびその装置
US5353132A (en) * 1989-02-06 1994-10-04 Canon Kabushiki Kaisha Image processing device
JP3223512B2 (ja) * 1990-12-19 2001-10-29 ソニー株式会社 画像表示方法及び装置
US5157740A (en) * 1991-02-07 1992-10-20 Unisys Corporation Method for background suppression in an image data processing system
JP2852390B2 (ja) * 1991-02-16 1999-02-03 株式会社半導体エネルギー研究所 表示装置
US5265173A (en) 1991-03-20 1993-11-23 Hughes Aircraft Company Rectilinear object image matcher
JPH06121161A (ja) 1991-05-14 1994-04-28 Fuji Xerox Co Ltd カラー画像処理装置の文字処理方式
US5280367A (en) * 1991-05-28 1994-01-18 Hewlett-Packard Company Automatic separation of text from background in scanned images of complex documents
JP3276985B2 (ja) * 1991-06-27 2002-04-22 ゼロックス・コーポレーション イメージピクセル処理方法
US5696842A (en) * 1991-07-04 1997-12-09 Ricoh Company, Ltd. Image processing system for adaptive coding of color document images
US5436981A (en) * 1992-06-24 1995-07-25 Canon Kabushiki Kaisha Image processing method, and apparatus therefor
US5379130A (en) * 1992-12-02 1995-01-03 Industrial Technology Research Institute Text/image separation method
US5339172A (en) * 1993-06-11 1994-08-16 Xerox Corporation Apparatus and method for segmenting an input image in one of a plurality of modes
US5362796A (en) 1993-08-09 1994-11-08 Isp Investments Inc. Molded crosslinked vinyl lactam polymer gel and method of preparation
JPH07107275A (ja) 1993-10-06 1995-04-21 Konica Corp 画像領域判別装置
US5689575A (en) * 1993-11-22 1997-11-18 Hitachi, Ltd. Method and apparatus for processing images of facial expressions
US5546474A (en) * 1993-12-21 1996-08-13 Hewlett-Packard Company Detection of photo regions in digital images
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JPH07220091A (ja) * 1994-02-04 1995-08-18 Canon Inc 画像処理装置及び方法
US5481622A (en) * 1994-03-01 1996-01-02 Rensselaer Polytechnic Institute Eye tracking apparatus and method employing grayscale threshold values
EP0688536B1 (de) * 1994-03-23 2000-08-02 Erbe Elektromedizin GmbH Multifunktionales Instrument für die Ultraschall-Chirurgie
EP0677812B1 (en) * 1994-04-15 2001-11-21 Canon Kabushiki Kaisha Document storage and retrieval system
DE69519323T2 (de) * 1994-04-15 2001-04-12 Canon Kk System zur Seitensegmentierung und Zeichenerkennung
JPH07322252A (ja) * 1994-05-23 1995-12-08 Canon Inc 画像符号化装置
US5917945A (en) 1994-06-15 1999-06-29 Metanetics Corporation Recognizing dataforms in image areas
US5903363A (en) * 1994-08-04 1999-05-11 Canon Kabushiki Kaisha Image processing apparatus and method
US5694228A (en) * 1994-08-09 1997-12-02 Ricoh Company,Ltd. Document image processor with defect detection
US5987171A (en) * 1994-11-10 1999-11-16 Canon Kabushiki Kaisha Page analysis system
US6215904B1 (en) * 1994-11-30 2001-04-10 Xerox Corporation Apparatus and method for selecting encoding schemes based upon image content
US5581667A (en) * 1994-12-23 1996-12-03 Xerox Corporation Electronic trapping system for digitized text and images
EP0724229B1 (en) * 1994-12-28 2001-10-10 Canon Kabushiki Kaisha Image processing apparatus and method
US5649025A (en) * 1995-02-03 1997-07-15 Xerox Corporation Multithresholding for document image segmentation
JPH08305846A (ja) * 1995-03-07 1996-11-22 Matsushita Electric Ind Co Ltd ニューロフィルターと像域分割方法とフィルター装置
US5682249A (en) * 1995-05-11 1997-10-28 Xerox Corporation Method of encoding an image at full resolution for storing in a reduced image buffer
US5995665A (en) * 1995-05-31 1999-11-30 Canon Kabushiki Kaisha Image processing apparatus and method
GB9513376D0 (en) * 1995-06-30 1995-09-06 Gordon & Co Ltd H Fire protection of steelwork
JP3774498B2 (ja) 1996-01-08 2006-05-17 キヤノン株式会社 画像処理方法とその装置
JPH09204525A (ja) 1996-01-29 1997-08-05 Canon Inc 画像像域分離装置及びその方法
US6389162B2 (en) * 1996-02-15 2002-05-14 Canon Kabushiki Kaisha Image processing apparatus and method and medium
US5923775A (en) * 1996-04-04 1999-07-13 Eastman Kodak Company Apparatus and method for signal dependent noise estimation and reduction in digital images
US5946420A (en) * 1996-05-10 1999-08-31 Hewlett-Packard Company Printing with text enhancement: recognition by sensing paired edges, or by disqualification in pictorial regions
JP2973944B2 (ja) * 1996-06-26 1999-11-08 富士ゼロックス株式会社 文書処理装置および文書処理方法
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
US5960104A (en) 1996-08-16 1999-09-28 Virginia Polytechnic & State University Defect detection system for lumber
US5778092A (en) * 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
US5767978A (en) * 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system
US5900953A (en) 1997-06-17 1999-05-04 At&T Corp Method and apparatus for extracting a foreground image and a background image from a color document image
US6222932B1 (en) 1997-06-27 2001-04-24 International Business Machines Corporation Automatic adjustment of image watermark strength based on computed image texture
US6298173B1 (en) 1997-10-03 2001-10-02 Matsushita Electric Corporation Of America Storage management system for document image database
US6014464A (en) 1997-10-21 2000-01-11 Kurzweil Educational Systems, Inc. Compression/ decompression algorithm for image documents having text graphical and color content
US6347153B1 (en) * 1998-01-21 2002-02-12 Xerox Corporation Method and system for classifying and processing of pixels of image data
US6175650B1 (en) * 1998-01-26 2001-01-16 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
US6252994B1 (en) 1998-01-26 2001-06-26 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
JP4662584B2 (ja) * 1998-01-27 2011-03-30 イーストマン コダック カンパニー 画像センサのライン毎ノイズ除去装置及び方法
JPH11213090A (ja) 1998-01-29 1999-08-06 Nippon Telegr & Teleph Corp <Ntt> 文字図形と背景領域の識別方法およびその装置およびその方法を記録した記録媒体
US6020979A (en) * 1998-03-23 2000-02-01 Xerox Corporation Method of encoding high resolution edge position information in continuous tone image information
US6175427B1 (en) * 1998-04-20 2001-01-16 Xerox Corporation System and method of tonal correction of independent regions on a compound document
AUPP400998A0 (en) 1998-06-10 1998-07-02 Canon Kabushiki Kaisha Face detection in digital images
US6233353B1 (en) * 1998-06-29 2001-05-15 Xerox Corporation System for segmenting line drawings from text within a binary digital image
JP3453085B2 (ja) 1998-07-23 2003-10-06 ジーイー横河メディカルシステム株式会社 X線ct装置
US6308179B1 (en) * 1998-08-31 2001-10-23 Xerox Corporation User level controlled mechanism inter-positioned in a read/write path of a property-based document management system
US6272240B1 (en) * 1998-09-23 2001-08-07 Xerox Corporation Image segmentation apparatus and method
US6360009B2 (en) * 1998-09-23 2002-03-19 Xerox Corporation Image segmentation apparatus and method
US6178260B1 (en) * 1998-09-23 2001-01-23 Xerox Corporation Image segmentation apparatus and method
US6782129B1 (en) * 1998-09-23 2004-08-24 Xerox Corporation Image segmentation apparatus and method
US6389164B2 (en) * 1998-09-23 2002-05-14 Xerox Corporation Image segmentation apparatus and method
US6400844B1 (en) * 1998-12-02 2002-06-04 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6373981B1 (en) * 1998-12-21 2002-04-16 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6360007B1 (en) 1998-12-22 2002-03-19 Xerox Corporation Dynamic optimized color lut transformations based upon image requirements
EP1024442A3 (en) 1999-01-29 2003-04-02 Canon Kabushiki Kaisha Conversion between image representations used in image retrieval, and background exclusion
IL131282A (en) * 1999-08-05 2009-02-11 Orbotech Ltd Apparatus and methods for inspection of objects
AU7586800A (en) * 1999-09-16 2001-04-17 Applied Science Fiction, Inc. Method and system for altering defects in a digital image
US6668080B1 (en) * 1999-09-21 2003-12-23 Microsoft Corporation Automated layer extraction and pixel assignment from image sequences
US6535633B1 (en) * 1999-09-24 2003-03-18 Bank One Method and apparatus for re-classifying color image pixels classified by single channel segmentation
US6594401B1 (en) * 1999-10-20 2003-07-15 Xerox Corporation Detection and elimination of scanning artifacts
US6577762B1 (en) * 1999-10-26 2003-06-10 Xerox Corporation Background surface thresholding
US6728391B1 (en) * 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
US6718059B1 (en) * 1999-12-10 2004-04-06 Canon Kabushiki Kaisha Block selection-based image processing
US7015978B2 (en) 1999-12-13 2006-03-21 Princeton Video Image, Inc. System and method for real time insertion into video with occlusion on areas containing multiple colors
GB2357649A (en) * 1999-12-22 2001-06-27 Nokia Mobile Phones Ltd Image enhancement using inverse histogram based pixel mapping
EP1119186A3 (en) * 2000-01-19 2002-07-31 Xerox Corporation Method for generating anti-aliased text and line graphics in compressed document images
JP3814456B2 (ja) 2000-02-07 2006-08-30 キヤノン株式会社 画像処理装置及びその方法
US6473522B1 (en) 2000-03-14 2002-10-29 Intel Corporation Estimating text color and segmentation of images
US6901164B2 (en) 2000-04-14 2005-05-31 Trusight Ltd. Method for automated high speed improvement of digital color images
JP4496602B2 (ja) 2000-05-17 2010-07-07 コニカミノルタビジネステクノロジーズ株式会社 画像処理方法および画像処理装置
US6778291B1 (en) * 2000-06-12 2004-08-17 Hewlett-Packard Development Company, L.P. Fast page analyzer for proper selection of compression engine for rendered data
JP3986732B2 (ja) * 2000-06-21 2007-10-03 パイオニア株式会社 映像信号の輝度レベル補正装置
JP3715905B2 (ja) 2001-06-26 2005-11-16 キヤノン株式会社 画像処理装置、画像処理方法、プログラム並びに記憶媒体
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
US6766053B2 (en) * 2000-12-15 2004-07-20 Xerox Corporation Method and apparatus for classifying images and/or image regions based on texture information
US6941014B2 (en) * 2000-12-15 2005-09-06 Xerox Corporation Method and apparatus for segmenting an image using a combination of image segmentation techniques
US6522791B2 (en) * 2001-01-23 2003-02-18 Xerox Corporation Dynamic user interface with scanned image improvement assist
US6853755B2 (en) * 2001-03-28 2005-02-08 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive compression of scanned documents
JP2002325182A (ja) 2001-04-25 2002-11-08 Sharp Corp 画像処理方法および画像処理装置並びにそれを備えた画像形成装置
GB2375908B (en) 2001-05-23 2003-10-29 Motorola Inc Image transmission system image transmission unit and method for describing texture or a texture-like region
CN1213592C (zh) * 2001-07-31 2005-08-03 佳能株式会社 采用自适应二值化的图象处理方法和设备
US6983068B2 (en) * 2001-09-28 2006-01-03 Xerox Corporation Picture/graphics classification system and method
JP4029316B2 (ja) 2001-10-18 2008-01-09 日本電気株式会社 画像種別識別方法および装置と画像処理プログラム
US7194140B2 (en) 2001-11-05 2007-03-20 Canon Kabushiki Kaisha Image processing apparatus and method which compresses image data of each region using a selected encoding method
EP1445941A4 (en) * 2001-11-13 2006-09-20 Seiko Epson Corp COLOR IMPLEMENTATION DEVICE, COLOR IMPLEMENTATION PROCEDURE, COLOR CHANGE PROGRAM AND RECORDING MEDIUM
US7424129B2 (en) * 2001-11-19 2008-09-09 Ricoh Company, Ltd Printing system with embedded audio/video content recognition and processing
EP1318665B1 (en) * 2001-12-06 2015-02-25 Canon Kabushiki Kaisha Image processing apparatus and method, program, and storage medium
US7221805B1 (en) 2001-12-21 2007-05-22 Cognex Technology And Investment Corporation Method for generating a focused image of an object
US7027647B2 (en) 2001-12-31 2006-04-11 Hewlett-Packard Development Company, L.P. Coder matched layer separation for compression of compound documents
US8103104B2 (en) * 2002-01-11 2012-01-24 Hewlett-Packard Development Company, L.P. Text extraction and its application to compound document image compression
US6941024B2 (en) * 2002-01-14 2005-09-06 Hewlett-Packard Development Company, L.P. Coder matched layer separation and interpolation for compression of compound documents
US7085422B2 (en) * 2002-02-20 2006-08-01 International Business Machines Corporation Layer based compression of digital images
US20040205568A1 (en) * 2002-03-01 2004-10-14 Breuel Thomas M. Method and system for document image layout deconstruction and redisplay system
US7181086B2 (en) 2002-06-06 2007-02-20 Eastman Kodak Company Multiresolution method of spatially filtering a digital image
US7085420B2 (en) * 2002-06-28 2006-08-01 Microsoft Corporation Text detection in continuous tone image segments
US6987882B2 (en) 2002-07-01 2006-01-17 Xerox Corporation Separation system for Multiple Raster Content (MRC) representation of documents
JP4194336B2 (ja) * 2002-07-25 2008-12-10 富士通マイクロエレクトロニクス株式会社 半導体集積回路、欠陥画素補正方法、及び画像プロセッサ
US6993185B2 (en) * 2002-08-30 2006-01-31 Matsushita Electric Industrial Co., Ltd. Method of texture-based color document segmentation
JP2004110606A (ja) 2002-09-20 2004-04-08 Pfu Ltd 画像処理装置及び方法並びにプログラム
US6918706B2 (en) * 2002-10-31 2005-07-19 Canon Kabushiki Kaisha Reducing a difference in picture quality between deteriorated and non-deteriorated images using a printing apparatus
US7400770B2 (en) 2002-11-06 2008-07-15 Hrl Laboratories Method and apparatus for automatically extracting geospatial features from multispectral imagery suitable for fast and robust extraction of landmarks
US20040096102A1 (en) 2002-11-18 2004-05-20 Xerox Corporation Methodology for scanned color document segmentation
US7079687B2 (en) * 2003-03-06 2006-07-18 Seiko Epson Corporation Method and apparatus for segmentation of compound documents
US7139433B2 (en) * 2003-03-13 2006-11-21 Sharp Laboratories Of America, Inc. Compound image compression method and apparatus
US20040190028A1 (en) * 2003-03-31 2004-09-30 Foster Thomas J. Post RIP image rendering in an electrographic printer in order to minimize electrophotographic process nonuniformities
US7330288B2 (en) * 2003-03-31 2008-02-12 Eastman Kodak Company Post RIP image rendering in a MICR electrographic printer to improve readability
JP3984936B2 (ja) * 2003-08-08 2007-10-03 キヤノン株式会社 撮像装置および撮像方法
US7483484B2 (en) * 2003-10-09 2009-01-27 Samsung Electronics Co., Ltd. Apparatus and method for detecting opaque logos within digital video signals
JP3775409B2 (ja) * 2003-10-29 2006-05-17 ブラザー工業株式会社 画像読取装置
US7912291B2 (en) * 2003-11-10 2011-03-22 Ricoh Co., Ltd Features for retrieval and similarity matching of documents from the JPEG 2000-compressed domain
US7317829B2 (en) 2003-12-12 2008-01-08 Microsoft Corporation Background color estimation for scanned images
JP4745252B2 (ja) 2004-01-06 2011-08-10 トムソン ライセンシング 可視的認証パターンを検出、解析および使用するための改良された技法
US20050152616A1 (en) * 2004-01-09 2005-07-14 Bailey James R. Method and apparatus for automatic scanner defect detection
JP4182891B2 (ja) 2004-01-26 2008-11-19 富士ゼロックス株式会社 画像処理装置
US7379594B2 (en) * 2004-01-28 2008-05-27 Sharp Laboratories Of America, Inc. Methods and systems for automatic detection of continuous-tone regions in document images
US7343046B2 (en) 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
SE0400325D0 (sv) * 2004-02-13 2004-02-13 Mamea Imaging Ab Method and arrangement relating to x-ray imaging
US7324711B2 (en) * 2004-02-26 2008-01-29 Xerox Corporation Method for automated image indexing and retrieval
JP4244018B2 (ja) * 2004-03-25 2009-03-25 ノーリツ鋼機株式会社 欠陥画素修正方法、プログラム及びその方法を実施する欠陥画素修正システム
US7542082B2 (en) * 2004-03-30 2009-06-02 Canon Kabushiki Kaisha Method and apparatus for correcting a defective pixel
EP1594308A1 (en) * 2004-05-07 2005-11-09 Dialog Semiconductor GmbH Single line Bayer filter RGB bad pixel correction
EP1605403A1 (en) * 2004-06-08 2005-12-14 STMicroelectronics S.r.l. Filtering of noisy images
JP2005354278A (ja) * 2004-06-09 2005-12-22 Seiko Epson Corp 撮像手段の撮像した画像の画像データを処理する画像データ処理
US7376265B2 (en) 2004-06-17 2008-05-20 Seiko Epson Corporation Segmentation-based hybrid compression scheme for scanned documents
US7324687B2 (en) 2004-06-28 2008-01-29 Microsoft Corporation Color segmentation-based stereo 3D reconstruction system and process
JP4166744B2 (ja) * 2004-10-18 2008-10-15 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
US7991224B2 (en) 2004-12-21 2011-08-02 Canon Kabushiki Kaisha Segmenting digital image and producing compact representation
US7433513B2 (en) * 2005-01-07 2008-10-07 Hewlett-Packard Development Company, L.P. Scaling an array of luminace values
JP2006260401A (ja) * 2005-03-18 2006-09-28 Toshiba Corp 画像処理装置、方法、およびプログラム
US7233867B2 (en) 2005-04-06 2007-06-19 General Electric Company Eddy current inspection method and system
KR101108435B1 (ko) 2005-05-31 2012-02-16 서강대학교산학협력단 의사윤곽 제거 방법 및 이 방법이 적용되는 디스플레이장치
US8630498B2 (en) 2006-03-02 2014-01-14 Sharp Laboratories Of America, Inc. Methods and systems for detecting pictorial regions in digital images
US8437054B2 (en) * 2006-06-15 2013-05-07 Sharp Laboratories Of America, Inc. Methods and systems for identifying regions of substantially uniform color in a digital image
US20080310721A1 (en) 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06152945A (ja) * 1992-11-06 1994-05-31 Canon Inc 画像処理装置
JPH09251533A (ja) * 1996-03-18 1997-09-22 Babcock Hitachi Kk 画像領域の抽出方法
JP2003303346A (ja) * 2002-04-09 2003-10-24 Nippon Telegr & Teleph Corp <Ntt> 目標追跡方法、目標追跡装置、目標追跡プログラム、並びにこのプログラムを記録した記録媒体
JP2005159576A (ja) * 2003-11-21 2005-06-16 Sharp Corp 画像処理方法及び画像処理装置並びに画像形成装置、プログラム、記録媒体
JP2005353101A (ja) * 2005-08-25 2005-12-22 Ricoh Co Ltd 画像特徴抽出方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
US20110096993A1 (en) 2011-04-28
JP2007336562A (ja) 2007-12-27
US7864365B2 (en) 2011-01-04
US20070291288A1 (en) 2007-12-20
US8368956B2 (en) 2013-02-05

Similar Documents

Publication Publication Date Title
JP4745296B2 (ja) デジタル画像の領域分離方法および領域分離システム
JP4745297B2 (ja) デジタル画像における均一な色の領域を特定する方法およびシステム
JP4340701B2 (ja) デジタル画像のテキストを識別する方法およびシステム
US9135722B2 (en) Perceptually lossless color compression
JP4242532B2 (ja) デジタル画像データ区分方法
US8059892B1 (en) Image enhancement method and apparatus
JP4667062B2 (ja) 画像解析装置、画像解析方法、及びブロブ識別装置
JP4994017B2 (ja) 文書画像を示す走査データを処理するための方法
US20050163374A1 (en) Methods and systems for automatic detection of continuous-tone regions in document images
US7907778B2 (en) Segmentation-based image labeling
US20080181496A1 (en) Methods and Systems for Detecting Character Content in a Digital Image
JP2000175051A (ja) デジタル画像デ―タの区分方法並びにデ―タブロックの区分方法及び分類方法
JPH09212677A (ja) 画像領域分割方法及びその装置
JP4745430B2 (ja) デジタル画像のテキストの位置決定を行う方法およびシステム
US9158987B2 (en) Image processing device that separates image into plural regions
JP4423333B2 (ja) 背景領域特定方法、背景領域特定システム、背景色決定方法、制御プログラム、および、記録媒体
JP2004336282A (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
JP4649498B2 (ja) 画像データの色補正方法及びシステム
JP4217969B2 (ja) 画像処理装置及びプログラム
JP2004201303A (ja) セグメンテーション・ベースのハーフトーニング
US20060269132A1 (en) Apparatus and method for detecting white areas within windows and selectively merging the detected white areas into the enclosing window
JP2003271973A (ja) 画像処理方法および画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091021

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110419

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110511

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4745296

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150