JP2993533B2 - 情報処理装置及び文字認識装置 - Google Patents

情報処理装置及び文字認識装置

Info

Publication number
JP2993533B2
JP2993533B2 JP3213665A JP21366591A JP2993533B2 JP 2993533 B2 JP2993533 B2 JP 2993533B2 JP 3213665 A JP3213665 A JP 3213665A JP 21366591 A JP21366591 A JP 21366591A JP 2993533 B2 JP2993533 B2 JP 2993533B2
Authority
JP
Japan
Prior art keywords
character
block
unit
dictionary
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3213665A
Other languages
English (en)
Other versions
JPH0554183A (ja
Inventor
浩史 吉田
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3213665A priority Critical patent/JP2993533B2/ja
Publication of JPH0554183A publication Critical patent/JPH0554183A/ja
Application granted granted Critical
Publication of JP2993533B2 publication Critical patent/JP2993533B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、複数の文字ブロック
で構成された文書画像から、各文字ブロック間の順序関
係を判定することのできる情報処理装置と、この情報処
理装置を具える文字認識装置に関するものである。
【0002】
【従来の技術】機械が媒体上の文書画像から該文書が持
つ情報を正解に得ることが出来れば、種々の機能を持つ
情報処理装置、例えば文書画像を蓄積するファイリング
装置、文字認識装置、認識した文字を音声出力するよう
な装置、認識した文字を翻訳する装置等の構築が可能に
なる。しかし、文書画像には、例えば図3に示すよう
に、罫線或いは空白(図示例は空白)と、文字列が密に
配列され上述の空白により周囲と分離している複数の文
字ブロック(図3では31〜34)とで構成されたよう
な文書画像が多々あり、このような文書画像の認識処理
に当たっては、書式既知の文書画像の処理とは異なり、
文字ブロックを抽出し各文字ブロック間の順序関係を判
定する、という特別の処理が必要になる。
【0003】そこで、これを行い得る従来装置として、
例えば文献1:電子情報通信学会技術研究報告PRU8
6−33に開示された書式未知文書の自動読取装置があ
った。この文献に開示されている装置では、書式未知の
文書より、周辺分布特徴、線密度特徴、外接矩形特徴を
用いて、見出し文字ブロックや本文文字ブロック等の文
書構成要素が抽出され、さらにこれら各文字ブロックか
ら各文字が抽出され、さらに各文字に対して特徴抽出が
行われて各文字が認識される。
【0004】また、この際、各文字ブロックの順序関係
は、例えば文献2:電子情報通信学会論文誌(198
6.3)VOL.J69−D,No.3,P404に開
示されているように、次式(1)に従い各文字ブロック
の文書中における位置評価hが算出され、このhが小さ
い順とされるのが一般的であった。
【0005】 h=Xc+ε・Yc (1)
【0006】ここで、Xcは各文字ブロックの左上隅の
X座標、Ycは各文字ブロックの左上隅のY座標、εは
0.1程度の定数をそれぞれ示す。
【0007】
【発明が解決しようとする課題】しかしながら、上述し
た文献に開示された自動読取装置では、図3に示した文
書画像のような場合に、文字ブロック31〜34の正規
な順序関係が、31→33→32→34というような場
合であっても、上記位置評価値hに従うため31→32
→33→34という順序関係であると判定されてしま
い、書体の異なる文字ブロックの正確な順序関係の判定
を行うことが出来ないという問題点があった。
【0008】従って、この方法を文書画像を蓄積するフ
ァイリング装置に適用した場合には正しい順序で蓄積出
来ないので、蓄積された文書画像データを効率的に利用
出来なくなるという問題が生じる。また、この方法を文
字認識装置に適用した場合、正しい順序で文字認識を行
うことが出来ないため、文字認識装置として実用に耐え
られなくなる。また、文字認識装置においては正確な認
識結果を得るために、文字単位の認識処理の後に、何ら
かの後処理、例えば言語情報を用いた言語処理を行う場
合があるが、この後処理は認識結果の文字の並びに対し
て処理を行う場合がほとんどであり、前述のように正し
い順序で認識が行われない場合には、この後処理が全く
機能しなくなり、従って認識精度が著しく低下すること
になる。また、これを防止するため、或いは結果を修正
するためには、オペレータによる順序指示作業、或いは
修正作業が必要となるが、この作業は煩雑であるため操
作性が悪化し、結局実用上有効な高性能な文字認識装置
は実現できない、という問題点があった。
【0009】この発明はこのような点に鑑みなされたも
のであり、従ってこの発明の目的は、文字ブロック間の
順序関係を正確に判定することが出来る情報処理装置、
及びこれを具える文字認識装置を提供することにある。
【0010】
【課題を解決するための手段】この目的を達成するため
に、本発明の情報処理装置は、文書画像より文字ブロッ
クを抽出すると共に文字ブロックの位置関係に基づいて
文字ブロック間の仮の順序関係を判定する文字ブロック
抽出部と、抽出された文字ブロックより文字パタンを切
り出す文字切り出し部と、文字の属性によって分類され
た複数種の辞書を有する辞書部と、前記文字切り出し部
によって切り出された文字パタンと前記辞書とを照合し
候補文字名と共に該候補文字の辞書名を前記文字ブロッ
ク毎に出力する文字認識部と、当該文字ブロックが如何
なる属性の文字によって構成されているかという文字ブ
ロックの属性を判定する為の文字ブロック属性特徴を前
記候補文字の辞書名に基づいて抽出するブロック特徴抽
出部と、前記文字ブロック間の仮の順序関係から文字ブ
ロックの属性に基づいた新たな順序関係を判定する判定
部とを備えたことを特徴とする。
【0011】また本発明の文字認識装置は、文書画像を
入力する画像入力部と、請求項1記載の情報処理装置
と、前記情報処理装置内の文字認識部における文字認識
結果を文字ブロック毎に記憶する認識結果記憶部と、前
記情報処理装置内の判定部における文字ブロックの順序
関係の判定結果に基づいて前記認識結果記憶部より認識
結果を出力するブロック選択部とを備えたことを特徴と
する。
【0012】
【作用】この発明の情報処理装置によれば、文書画像か
ら抽出された文字ブロックの位置関係に基づいて文字ブ
ロック間の仮の順序関係が判定される。また、文字ブロ
ックから切り出された文字パタンと、書体等の文字の属
性によって予め分類され複数種用意されている辞書とを
照合して認識を行うことにより、候補文字名と共に候補
文字の辞書名が得られる。この候補文字の辞書名、例え
ば第1位の候補文字の辞書名の内最も多く参照された辞
書名に基づいて、各文字ブロックが如何なる属性の文字
によって構成されているかを判定する為の文字ブロック
属性特徴が抽出される。この文字ブロック属性特徴に基
づいて、文字ブロック間の仮の順序関係から文字ブロッ
ク間の属性の連続性が保存された新たな順序関係が得ら
れる。従って、各文字ブロックのレイアウトに規則性の
無い文書から文字ブロックを抽出し出力する場合でも、
各ブロックを文字の属性に基づいて正しい順序関係で出
力出来る。
【0013】また、この発明の情報処理装置を文字認識
装置に適用した場合には、上述のように正しい順序で出
力される文字ブロックについて文字認識を行うことが出
来るため例えばレイアウトに規則性の無い文書の文字認
識を文書の流れに即して行うことが出来る。
【0014】
【実施例】以下、図1〜図6を用いて、この発明の情報
処理装置及び文字認識装置の実施例について説明する。
【0015】図1は本発明の情報処理装置120を用い
た文書画像ファイリング装置100の構成を示すブロッ
ク図である。この文書画像ファイリング装置100は、
画像入力部110、本発明の情報処理装置120、ブロ
ック選択部130、画像記憶部140、及び出力端子1
50を備える。また、この情報処理装置120は文字ブ
ロック抽出部121、文字切り出し部122、文字認識
部123、辞書部126、ブロック特徴抽出部124、
判定部125を具える。尚、辞書部126は、書体の異
なる辞書マトリクスを格納した第1の辞書126a及び
第2の辞書126bより構成されている。
【0016】図2は文字認識部123の構成を示すブロ
ック図であり、サブパタン抽出部201、特徴抽出部2
02、照合部203を具えている。
【0017】図3は、文書画像の一例を示す図であり、
文書画像30は、空白部によって分離されたローマン系
書体の文字ブロック31、33及びサンセリフ系書体の
文字ブロック32、34で構成されている。
【0018】図4は、辞書部126における第1の辞書
126a、及び、第2の辞書126bの説明に供する図
であり、本実施例では、例えば第1の辞書はローマン系
書体を標準パタンとし、第2の辞書はサンセリフ系書体
を標準パタンとする辞書である。
【0019】図5は、ブロック特徴抽出部124の説明
に供する図であり、(A)は文字ブロック31の先頭行
の文字列、第1位候補文字、当該候補文字を得た辞書マ
トリクスの辞書番号を表し、以下(B),(C)、及び
(D)は各々文字ブロック32、33、34の先頭行の
文字列、第1位候補文字、及び辞書マトリクスの辞書番
号を表している。
【0020】(第1の実施例)以下に、第1の実施例で
ある本発明の情報処理装置を用いた文書画像ファイリン
グ装置の各構成成分の動作について図1から図5を用い
て詳細に説明する。
【0021】画像入力部110は、例えば従来公知のイ
メージセンサ等で構成出来、文字・図形等(以下、文字
と称する。)が記載された例えば図3に示すような文書
画像30からの光信号Sを、例えば文字線部を黒ビット
及び背景部を白ビットで表現した2値のディジタル信号
(これを入力画像データという。)に変換し、この入力
画像データを情報処理装置120の文字ブロック抽出部
121に出力する。
【0022】情報処理装置120の文字ブロック抽出部
121は、画像入力部110より入力された入力画像デ
ータより文書画像の文字ブロックに対応するデータ(こ
れを文字ブロックデータと称する)を抽出し、文字切り
出し部122及びブロック選択部130に夫々出力す
る。例えば図3に示す文書画像30の例で説明すれば、
文字列が規則正しく密に配列し空白等により周囲と分離
した領域31〜34(これらの領域各々が文字ブロック
になる)を抽出する。
【0023】ここで、文字ブロックデータの抽出は従来
公知の種々の方法で行うことが出来るが、この実施例で
は以下に説明するような方法で行う。先ず、入力画像デ
ータを縦方向(図3中yで示す方向に相当する方向)に
走査し周辺分布を作成する。次に、この周辺分布におい
て、黒ビット数が0から1以上に変化する走査線より1
以上から0に変化する直前の走査線までで規定される領
域を列方向の1ブロックとして検出する。
【0024】次に、この列方向の、1ブロックに対応す
る入力画像データ部分を、今度は横方向(図3中xで示
す方向に相当する方向)に走査し横方向の周辺分布にお
いて、黒ビット数が0から1以上に変化する走査線より
1以上から0に変化する直前の走査線までで規定される
領域の幅が、閾値THより大きかったならばこの領域と
前述の列方向のブロックとの重複部分のデータを文字ブ
ロックデータとして抽出する。尚、閾値THは、文字の
大きさ、フォント等により決定されるパラメータであ
り、本実施例ではTH=140である。
【0025】また、抽出された前記文字ブロックの出力
順序(この順序関係を仮の順序関係と称する)は、各文
字ブロックの位置情報を用いて、式(2)により各文字
ブロックの文書画像における位置評価値Ei (但しiは
文字ブロック番号であり例えば図3の31〜34であ
る)を求め、このEi の昇順に出力する。
【0026】 Ei =yei+f・xei (2)
【0027】但し、式(2)において、xei、yeiは其
々当該文字ブロックに外接する矩形の左上隅のx、y座
標であり、fは予め定めた定数であり本実施例では10
である。なお、x、y座標は図3に示すx、y座標系に
よる。従って図3に示した文書画像の各文字ブロックの
出力順序は、31→32→33→34となる。
【0028】文字切り出し部122は、文字ブロック抽
出部121より入力された文字ブロックデータより、該
文字ブロックを構成している文字行を切り出し、さらに
この文字行より1文字づつの文字パタンを切り出し、該
切り出された文字パタンを文字ブロック毎に文字認識部
123内のサブパタン抽出部201(図2参照)に出力
する。
【0029】ここで、前記文字行の切り出しは、文字ブ
ロック抽出部121から入力された文字ブロックデータ
を、文字行方向を主走査方向として、また文字列方向を
副走査方向として順次走査し、黒画素の分布を作成し、
該黒画素の分布が「0」から「1」以上に変化する位置
から、「1」以上から「0」に変化する位置の直前の位
置までを文字行データとして検出することにより行う。
また、前記文字行からの文字パタンの切り出しは、前記
切り出された文字行データを、文字列方向を主走査方
向、文字行方向を副走査方向として走査し、黒画素の分
布を作成し、該黒画素の分布が「0」から「1」以上に
変化する位置から、「1」以上から「0」に変化する直
前の位置までを文字パタンデータとして順次切り出すこ
とにより行う。
【0030】図2のサブパタン抽出部201において
は、文字切り出し部122より入力された文字パタンを
複数の方向に走査し、各走査線上で予め定めた特定の値
h(本実施例ではh=5)以上連続している黒画素列を
検出し、該連続した黒画素列をサブパタンの黒画素成分
として抽出することにより、文字パタンより各走査方向
別のサブパタンを抽出し、該サブパタンを順次特徴抽出
部202に出力する。前記走査方向は、本実施例では、
文字行方向(以下、X軸方向)に垂直な方向(垂直方
向)、及び平行な方向(水平方向)、X軸から反時計方
向45°の方向(左斜め方向)及び時間方向45°の方
向(左斜め方向)とし、これら各方向毎に文字パタンを
走査して各方向別に4個のサブパタンを抽出する。
【0031】例えば垂直方向のサブパタンの抽出では垂
直方向を主走査方向とし、文字パタンデータを垂直方向
に走査し、該走査線上で連続する黒画素(黒ラン)を検
出し、L≧hとなる長さLの黒ランを垂直方向のサブパ
タンの黒画素部分として抽出することにより、垂直方向
サブパタンを抽出する。垂直方向のサブパタン抽出と同
様にして、残りの各方向を主走査方向としたときのサブ
パタンの抽出を行う。
【0032】特徴抽出部202においては、前記抽出さ
れた各方向のサブパタン上に、文字パタンの文字外接枠
に対応する方形領域を設定し、該方形領域をN×M個
(N、Mは任意好適な自然数)の小領域に分割し、各小
領域に含まれる各サブパタンの文字線の長さを表す特徴
量を抽出し、該特徴量を文字外接枠の大きさで正規化
し、正規化された特徴量fi からなる特徴マトリクスF
を作成し、照合部203に出力するものである。尚、本
実施例では、前記分割数N、M=8とし、また前記特徴
量の文字外接枠の大きさでの正規化は(dX+dY)/
2なる値で正規化するものとする。但し、dXは文字外
接枠の水平方向の長さ及びdYは文字外接枠の垂直方向
の長さである。また特徴量fi は、各小領域に1〜N×
Mまでの番号i(i=1、2、…、N×M)を順次に付
して小領域を表したときに、番号iの小領域の特徴量を
表し、特徴マトリクスFの要素値である。
【0033】照合部203は特徴マトリクスFを、辞書
部126に格納されている予め用意された、文字の属性
により2以上の種類に分類された標準パタンの特徴辞書
マトリクスGと照合し、次式(3)で表される類似度R
を求め、類似度Rが予め定めた値P以上である辞書マト
リクスの文字名を候補文字名とし、さらに類似度の高い
順に第1位候補文字、第2位候補文字と順位付けを行
い、1以上の候補文字名及び当該候補文字名を得る対象
となった標準パタンの辞書の種類を認識結果としてブロ
ック特徴抽出部124に出力する。
【0034】
【数1】
【0035】但し、gi は辞書マトリクスの要素を表
す。
【0036】辞書部126は前記文字認識部123内の
照合部203で、文字パタンより抽出した特徴マトリク
スと照合を行う標準パタンの特徴マトリクス、つまり辞
書マトリクスを格納しておくものであり、書体、標準体
/斜体、線幅、縦横比等の文字属性に応じて1の文字名
に対して2以上の辞書マトリクスが用意されているもの
である。
【0037】本実施例においては、図4(A)に示すよ
うなローマン系書体を標準パタンとして作成した第1の
辞書126a(辞書番号1)及び図4(B)に示すよう
なサンセリフ系書体を標準パタンとして作成した第2の
辞書126b(辞書番号2)の2の辞書より辞書部13
3は構成されており、前記文字認識部123内の照合部
203においては、照合結果の候補文字名と各候補文字
名を得るために用いた辞書が、前記第1の辞書である
か、第2の辞書であるかを示す辞書番号を出力する。本
実施例の辞書部126を用いて図3の31〜34の各文
字ブロックの先頭行を認識した場合の認識結果の例を図
5(A)〜(D)に示す。
【0038】ブロック特徴抽出部124は、文字認識部
123から入力された認識結果の候補文字名及び該候補
文字名を得た辞書の種類を、各文字ブロック毎に集計
し、各文字ブロックが如何なる属性の文字により構成さ
れているかという文字ブロックの属性を判定するための
文字ブロック属性特徴を抽出する。即ち、当該文字ブロ
ックを構成する全ての文字の認識結果の第1位候補文字
の辞書番号を集計する事により、最も多くの第1位候補
を得た辞書番号を、当該文字ブロックの属性特徴として
判定部125に出力する。
【0039】図3の31、32、33、34の各文字ブ
ロックについては、図5(A)〜(D)に例示したよう
に、31ではローマン系の辞書1が、32ではサンセリ
フ系の辞書2が、33ではローマン系の辞書1が、34
ではサンセリフ系の辞書2が各々最も出現回数が多いと
され、F31=1、F32=2、F33=1、F34=2なる文
字ブロック属性特徴値が得られる。但し、F31、F32
33、F34は、図3の31、32、33、34の各文字
ブロックの文字ブロック属性特徴値である。
【0040】判定部125ではブロック特徴抽出部12
4から出力される各文字ブロック属性特徴値を用いて文
字ブロック抽出部121において得られた仮の順序関係
から、文字ブロックの属性に基づいて、各文字ブロック
の新たな順序関係を判定し、判定結果をブロック選択部
130に出力する。文字ブロックの新たな順序関係の判
定は以下のように行う。
【0041】先ず、ブロック特徴抽出部124から出力
された各文字ブロック属性特徴値を、各文字ブロック間
で相互に比較し、当該文字ブロックが同一の属性特徴値
の文字ブロックであるか否か、つまり同一属性の文字に
より構成されているか否か、の判定を行う。この判定
は、2つの文字ブロックの文字ブロック属性特徴値が次
式(4)を満足するか否かにより行う。
【0042】 Fi =Fj (4)
【0043】但し、Fi は文字ブロックiの文字ブロッ
ク属性特徴値、Fj は文字ブロックjの文字ブロック属
性特徴値である。図3の帳票の例においては、前述した
ように各文字ブロックの文字特徴値は、F31=1、F32
=2、F33=1、F34=2であったので、F31=F33
32=F34の2つの組み合わせのみ前式(4)を満足す
る組み合わせとなる。従って、文字ブロック31と文字
ブロック33、及び文字ブロック32と文字ブロック3
4は、それぞれ同一属性の文字ブロックである、つまり
同一の書体の文字で構成されている文字ブロックである
と判定される。
【0044】さらに、判定部125においては、前記文
字ブロック比較結果に基づいて、前記仮の順序関係を以
下の手順で検定することにより、順次文字ブロックを選
択し新たな順序関係を得る。
【0045】先ず、仮の順序関係が第1番目である文
字ブロックを第1の文字ブロックとして選択し、かつ基
準の文字ブロックとする。
【0046】次に、前記基準の文字ブロックと同一の
種類の文字で構成されている文字ブロックを、前記文字
ブロック比較結果に基づき、仮の順序関係の順に選択す
る。
【0047】前記の選択を、仮に順序関係の最後ま
で終了したら、再び仮の順序関係上位の文字ブロックか
ら順次検定し、未だ前記及びによって未選択の文字
ブロックを探索する。
【0048】前記により最初に探索された未選択の
文字ブロックを選択すると共に基準の文字ブロックと
し、前記以降の処理を未選択の文字ブロックを対象に
して再び繰り返す。
【0049】前記の探索により未選択の文字ブロッ
クが存在しなかった場合には、文字ブロックの選択を終
了する。
【0050】上述したような手順で得られた新たな順序
関係は、ブロック選択部130に出力される。図3に示
すような帳票の文字ブロックは、前述した手順によれ
ば、最終的に得られる文字ブロックの順序関係は31→
33→32→34となる。
【0051】ブロック選択部130においては、前記文
字ブロック抽出部121から入力された文字ブロックデ
ータを、図示せぬ文字ブロックメモリに格納しておき、
情報処理装置120内の判定部125から出力された順
序関係判定結果に従って、順次文字ブロックデータを画
像記憶部140に出力する。
【0052】画像記憶部140は、ブロック選択部13
0から順序づけられて出力される各文字ブロックデータ
を順次文書画像データとして格納する為の記憶装置であ
り、ハードディスク、光磁気ディスク、フレキシブルデ
ィスク等で容易に実現出来る。また、画像記憶部140
は、図示しない制御装置により制御されており、指定さ
れた文書画像データを任意に選択し出力端子150に出
力できる。
【0053】(第2の実施例)図6は、本発明の情報処
理装置を用いた文字認識装置の構成を示すブロック図で
あり、文字認識装置600は、画像入力部610、情報
処理装置620、認識結果記憶部630、ブロック選択
部640、及び出力端子650を具え、また、この情報
処理装置620は、文字ブロック抽出部621、文字切
り出し部622、文字認識部623、辞書部626、ブ
ロック特徴抽出部624、判定部625を具える。なお
辞書部626は書体の異なる辞書マトリクスを格納した
第1の辞書626a及び第2の辞書626bより構成さ
れている。
【0054】この実施例の画像入力装置610、文字ブ
ロック抽出部621、文字切り出し部622、ブロック
特徴抽出部624、判定部625、辞書部626は其々
第1の実施例における画像入力装置110、文字ブロッ
ク抽出部121、文字切り出し部122、ブロック特徴
抽出部124、判定部125、辞書部126と同様の構
成要素であり、此等の説明は省略する。
【0055】文字認識部623においては、第1の実施
例と同様の方法により、入力された文字パタンよりサブ
パタンを抽出し、各サブパタンの文字線の長さを表す特
徴を抽出し、正規化された特徴量fi からなる特徴マト
リクスFを、予め辞書部626に格納され文字の属性に
より2以上の種類に分類された標準文字パタンの特徴辞
書マトリクスGと照合し、前式(3)で表される類似度
Rを求め、類似度が予め定めた閾値P以上である辞書マ
トリクスの文字名を候補文字名とし、更に、類似度の高
い順に第1位候補文字、第2位候補文字と順位付けを行
い、候補文字名及び当該候補文字名を得る対象となった
標準文字パタンの辞書の種類をブロック特徴抽出部62
4に出力すると共に候補文字名を認識結果記憶部630
に文字ブロック毎に出力する。
【0056】認識結果記憶部630は、文字認識部62
3より出力された各文字ブロックの認識結果を各文字ブ
ロック毎に記憶する記憶部である。また、認識結果記憶
部630は図示しない制御信号により、後述するブロッ
ク選択部640により選択された文字ブロックの文字単
位の認識結果を選択された順に出力できる構成となって
いる。
【0057】ブロック選択部640においては、判定部
625から出力された順序関係判定結果に従って文字ブ
ロック毎の認識結果を認識結果記憶部630より順次読
み込み、出力端子650に出力する。
【0058】以上、この発明の情報処理装置及び文字認
識装置の実施例について詳細に説明したが、この発明は
上述の実施例のみに限られるものではなく以下に説明す
るような種々の変更が可能である。
【0059】例えば、文字ブロックの抽出、文字行の切
り出し、文字パタンの切り出し、また文字認識に当たっ
ての特徴マトリクスの作成や類似度計算等は、実施例で
説明した方法に限られるものではなく他の好適な方法を
用い得ることは明かである。
【0060】また、本実施例では文字ブロック特徴を得
るための辞書番号の抽出は、当該文字ブロックの全ての
文字パタンについて行うものとしたが、これに限られる
ものではなく、任意に選択した一部の文字、例えば各文
字ブロック先頭文字行の文字パタンのみから特徴抽出を
行い、該先頭文字行の文字パタンの特徴から当該文字ブ
ロックの文字ブロック特徴を得るようにしても良い。
【0061】また、本実施例では、情報処理装置中の辞
書部においては、ローマン系の文字を標準パタンとする
第1の辞書と、サンセリフ系の文字を標準パタンとする
第2の辞書とを有する構成としたが、これに限られるも
のではなく、その他の書体、メディアム/ボールド等の
線幅、スタンダード/コンデンス等の縦横比、等の文字
属性の違いにより、2以上の辞書を作成しても良い。
【0062】また、上述の実施例では本発明の情報処理
装置を文書画像ファイリング装置及び文字認識装置に適
用したが、この情報処理装置は、文字ブロックの順序関
係を決定しこの順序に従い文字ブロックを順次に出力す
る画像処理装置、さらに、文字領域の順序関係を抽出し
て文書のレイアウト構造を抽出する装置等にも適用出来
る。
【0063】
【発明の効果】以上詳細に説明したように、この発明の
情報処理装置によれば、文書画像から仮の順序関係に従
って文字ブロックを抽出し、該文字ブロックから文字パ
タンを切り出し、文字パタンの特徴により分類されてい
る辞書と前記切り出された文字パタンを照合し、認識を
行い、1以上の候補文字の辞書名を得、該認識結果の候
補文字の辞書名より文字ブロック属性特徴を抽出し、こ
の文字ブロック属性特徴を用いて、各文字ブロックの新
たな順序関係を判定することが出来る。
【0064】従って、各文字ブロックのレイアウトに規
則性の無い文書から文字ブロックを抽出し出力する場合
でも、単に各文字ブロックの文書画像中の位置座標に基
づいて各文字ブロックを出力していた従来装置に比べ、
各ブロックを正しい順序関係で出力出来る。
【0065】従って、例えば文書画像ファイリング装置
等のような各種の文書画像処理装置に適用した場合に
は、正しい順序関係で文字ブロックのデータの利用が可
能となるので、高性能な各種の文書画像処理装置が可能
となる。
【0066】また、この発明の情報処理装置を文字認識
装置に適用した場合には、上述のように正しい順序で出
力される文字ブロックについて文字認識を行うことが出
来るため例えばレイアウトに規則性の無い文書の文字認
識を文書の流れに即して行うことが出来、実用上有効な
文字認識装置が実現できる。また、正しい順序で、認識
結果文字列が得られるので、文字単位の認識の後に行う
後処理が正しく行え、従って認識精度が向上し、またオ
ペレータの作業が減少し、ひいては高速に入力が出来
る。従って、レイアウトに規則性の無い文書においても
正確に高速に入力が可能となるような、高性能な文字認
識装置が実現できる。
【図面の簡単な説明】
【図1】本発明の情報処理装置を用いた文書画像ファイ
リング装置の構成を示すブロック図である。
【図2】文字認識部の構成を示すブロック図である。
【図3】文書画像の一例を示す図である。
【図4】辞書部の説明に供する図である。
【図5】ブロック特徴抽出部の説明に供する図である。
【図6】本発明の情報処理装置を用いた文字認識装置の
構成を示すブロック図である。
【符号の説明】
100 文書画像ファイリング装置 110 画像入力部 120 情報処理装置 130 ブロック選択部 140 画像記憶部 150 出力端子 600 文字認識装置 610 画像入力部 620 情報処理装置 630 認識結果記憶部 640 ブロック選択部 650 出力端子

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 文書画像より文字ブロックを抽出すると
    共に文字ブロックの位置関係に基づいて文字ブロック間
    の仮の順序関係を判定する文字ブロック抽出部と、 抽出された文字ブロックより文字パタンを切り出す文字
    切り出し部と、 文字の属性によって分類された複数種の辞書を有する辞
    書部と、 前記文字切り出し部によって切り出された文字パタンと
    前記辞書とを照合し候補文字名と共に該候補文字の辞書
    名を前記文字ブロック毎に出力する文字認識部と、 当該文字ブロックが如何なる属性の文字によって構成さ
    れているかという文字ブロックの属性を判定する為の文
    字ブロック属性特徴を前記候補文字の辞書名に基づいて
    抽出するブロック特徴抽出部と、 前記文字ブロック間の仮の順序関係から文字ブロックの
    属性に基づいた新たな順序関係を判定する判定部とを備
    えたことを特徴とする情報処理装置。
  2. 【請求項2】 文書画像を入力する画像入力部と、 請求項1記載の情報処理装置と、 前記情報処理装置内の文字認識部における文字認識結果
    を文字ブロック毎に記憶する認識結果記憶部と、 前記情報処理装置内の判定部における文字ブロックの順
    序関係の判定結果に基づいて前記認識結果記憶部より認
    識結果を出力するブロック選択部とを備えたことを特徴
    とする文字認識装置。
JP3213665A 1991-08-26 1991-08-26 情報処理装置及び文字認識装置 Expired - Lifetime JP2993533B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3213665A JP2993533B2 (ja) 1991-08-26 1991-08-26 情報処理装置及び文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3213665A JP2993533B2 (ja) 1991-08-26 1991-08-26 情報処理装置及び文字認識装置

Publications (2)

Publication Number Publication Date
JPH0554183A JPH0554183A (ja) 1993-03-05
JP2993533B2 true JP2993533B2 (ja) 1999-12-20

Family

ID=16642934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3213665A Expired - Lifetime JP2993533B2 (ja) 1991-08-26 1991-08-26 情報処理装置及び文字認識装置

Country Status (1)

Country Link
JP (1) JP2993533B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001023174A (ja) 1999-06-25 2001-01-26 Samsung Electronics Co Ltd チルト及び/または集束ずれ補償方法及びその装置

Also Published As

Publication number Publication date
JPH0554183A (ja) 1993-03-05

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US4903312A (en) Character recognition with variable subdivisions of a character region
US4408342A (en) Method for recognizing a machine encoded character
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JPH05242292A (ja) 分離方法
JP3452774B2 (ja) 文字認識方法
JPH0772905B2 (ja) 記号列の認識方法
JP3294995B2 (ja) 帳票読取装置
US5926564A (en) Character recognition method and apparatus based on 0-1 pattern representation of histogram of character image
JP4280355B2 (ja) 文字認識装置
US6947596B2 (en) Character recognition method, program and recording medium
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2993533B2 (ja) 情報処理装置及び文字認識装置
US7016535B2 (en) Pattern identification apparatus, pattern identification method, and pattern identification program
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP2001236467A (ja) パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2995818B2 (ja) 文字切り出し方法
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH08161432A (ja) 文字切り出し方法および文字切り出し装置
JP3151866B2 (ja) 英文字認識方法
JPH06259597A (ja) ドキュメントイメージ処理方法並びに文字認識システムおよびドキュメントイメージ処理装置