JP5298484B2 - 文書処理装置 - Google Patents

文書処理装置 Download PDF

Info

Publication number
JP5298484B2
JP5298484B2 JP2007241188A JP2007241188A JP5298484B2 JP 5298484 B2 JP5298484 B2 JP 5298484B2 JP 2007241188 A JP2007241188 A JP 2007241188A JP 2007241188 A JP2007241188 A JP 2007241188A JP 5298484 B2 JP5298484 B2 JP 5298484B2
Authority
JP
Japan
Prior art keywords
bookmark
document
browsing information
data
title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007241188A
Other languages
English (en)
Other versions
JP2009075627A (ja
Inventor
由夫 小巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2007241188A priority Critical patent/JP5298484B2/ja
Publication of JP2009075627A publication Critical patent/JP2009075627A/ja
Application granted granted Critical
Publication of JP5298484B2 publication Critical patent/JP5298484B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Description

この発明は、文書処理装置に関し、特に複数の電子化文書の出力制御に関する。
従来より複数の電子化文書を比較して表示することが一般的に行なわれている。
たとえば、比較対象としてデータを直接比較する方式がある。たとえばPC上のアプリケーションソフトにはテキストファイル間あるいはデータファイル間などを比較して表示するものがある。
これらファイルのデータ値自体を比較することにより、一方のファイル内容に対して他方のファイル内容を対応付けて対応箇所を明示することにより、互いに比較して表示することが可能である。
たとえば、特開平5−89119号公報においては、複数文書を行単位の組で出力することにより複数の文書データを比較する方式が示されている。
また、特公平6−77261号公報においては、文書画像情報のあるページとそれに関連する他のページ(たとえば、記述文のページと参照図面のページ)を対応付けることにより文書画像情報のあるページを検索した場合にそれに関連する他のページも同時に表示される文書画像情報検索システムが示されている。
特開平5−89119号公報 特公平6−77261号公報
しかしながら、スキャナ等で紙文書等を走査することで生成された文書画像のデータ値自体を比較することは容易ではない。
文書画像はテキストファイル等に比べてファイルサイズが大きく処理量が大きいという問題がある。
また、紙文書等を走査して得た画像データは、紙文書として同じ内容のものであっても走査時の条件によりデータ値が異なるという問題がある。
また、ファイルサイズを縮小するために圧縮処理を行なうことが多く、表示内容とデータとの対応付けが明確ではなく、データ自体の比較処理が難しいという問題がある。
一方で、文書の作者が作成日といったメタ情報を比較して同一または近い文書を探索して表示する方式がある。
データを直接に比較する場合に比べて、文書の形式を選ばず処理が高速であるという利点がある。メタ情報はファイル全体に対して付加される場合が多く、文書内容を比較し対応関係を明示するためには未だ利用されていない。
本発明は上記のような問題を解決するためになされたものであって、電子化文書の文書画像の閲覧可能な文書要素に対して付加されたメタ情報(以下、閲覧情報)を用いて文書画像の比較を行なうことにより処理の高速化を図るとともに、文書間の内容の違いを簡易に識別することが可能な文書処理装置を提供することを目的とする。
本発明に係る文書処理装置において、電子化文書は、文書画像と文書画像内での内容領域の位置を示す閲覧情報とを含む。閲覧情報は、文章画像内での少なくとも1つの内容領域に従って付与されるしおりデータを含む。文書処理装置は、複数の電子化文書にそれぞれ対応する閲覧情報の入力を受けて、それぞれの閲覧情報を記憶する閲覧情報記憶手段と、閲覧情報記憶手段に記憶された複数の閲覧情報に含まれるしおりデータをそれぞれ対応付ける閲覧情報対応決定部とを含む。
好ましくは、複数の電子化文書にそれぞれ対応して、対応する文書画像を表示するための複数の文書画像表示領域を有する表示手段と、複数の電子化文書にそれぞれ対応する文書画像の入力を受けて、それぞれの文書画像を記憶する文書画像記憶手段と、複数の電子化文書のうちの特定の電子化文書の閲覧情報に含まれるしおりデータを選択指示する選択手段と、文書画像記憶手段を参照して、選択手段による選択指示に従って選択指示された閲覧情報対応決定部により対応づけられた複数の閲覧情報に含まれるしおりデータの対応付けに従って複数の電子化文書のうちの他の電子化文書の文書画像内の内容領域を表示する表示制御手段とをさらに含む。
好ましくは、複数の電子化文書にそれぞれ対応して、対応する文書画像を表示するための複数の文書画像表示領域を有する表示手段と、複数の電子化文書にそれぞれ対応する文書画像の入力を受けて、それぞれの文書画像を記憶する文書画像記憶手段と、文書画像記憶手段を参照して、閲覧情報対応決定部により対応付けられた複数の閲覧情報に含まれるしおりデータの対応付けに従って複数の電子化文書それぞれにおける文書画像内の内容領域を複数の文書画像表示領域にそれぞれ表示する表示制御手段とをさらに含む。
特に、複数の電子化文書のうちの特定の電子化文書の閲覧情報に含まれるしおりデータを選択指示する選択手段をさらに含む。
好ましくは、閲覧情報対応決定部は、閲覧情報記憶手段に記憶された複数の閲覧情報に含まれるしおりデータに含まれる文書要素および位置情報あるいはこれらの組み合わせに基づいてそれぞれ対応付ける。
好ましくは、閲覧情報対応決定部は、閲覧情報記憶手段に記憶された複数の閲覧情報に含まれるしおりデータに含まれる同一のしおりタイトルが含まれるか否かを判断し、同一のしおりタイトルが含まれる場合には、同一のしおりタイトルが含まれるしおりデータの対応付けを実行し、同一のしおりタイトルが含まれない場合には、しおりデータの順序を規定するしおりIDに基いてしおりデータの対応付けを実行する。
特に、表示制御手段は、閲覧情報記憶手段に記憶された複数の閲覧情報に基いて複数の文書画像表示領域にそれぞれ対応して閲覧情報一覧を表示部に表示する。
特に、表示制御手段は、閲覧情報記憶手段に記憶された複数の閲覧情報に基づいて複数の文書画像表示領域を総括した閲覧情報一覧を表示部に表示する。
特に、表示制御手段は、閲覧情報対応決定部により対応づけられた複数の閲覧情報に含まれるしおりデータの対応付けに従って文書画像内の内容領域の一部領域を表示する。
本発明に係る文書処理装置は、閲覧情報対応決定部において、閲覧情報記憶手段に記憶された複数の閲覧情報に含まれるしおりデータをそれぞれ対応付ける。したがって、電子化文書の文書画像の閲覧可能な文書要素に対して付加されたメタ情報を用いて文書画像の比較を行なうことにより処理の高速化を図るとともに、文書間の内容の違いを簡易に識別することができる。
以下に、図面を参照しつつ本発明の実施の形態について説明する。以下の説明においては同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同一であるもものとする。
(実施の形態1)
図1は、本発明の実施の形態に従う文書処理装置を含むシステムの概略構成図である。
本実施の形態においては、代表的に本発明に係る文書処理方法を実行するPC(Personal Computer)について説明する。
図1を参照して、PC1は、たとえば同一のオフィス内に敷設されたネットワークであるLAN(Local Area Network)に接続されているサーバ装置SRVに接続されており、また、LANとWAN(Wide Area Network)との接続点にはサーバ装置SRVが設けられている。
また、PC1とは離れた別のオフィスにあるPC2については、サーバ装置SRVを介してデータが送受信される。
ここでサーバ装置SRVは、代表的にメールサーバ、FTP(File Transfer Protocol)サーバ、WEBサーバ、SMVサーバ等で構成される。
また、本例においては、スキャナSCN1は、LANと接続され、原稿を読取ることで文書画像を取得し、そして、文書画像を含む電子化文書をPC1に出力する。また、ネットワークを介してPC2に出力するものとする。
また、同様に、スキャナSCN2は、WANと接続され、原稿を読取ることで文書画像を取得し、そして、文書画像を含む電子化文書をPC2に出力する。また、ネットワークを介してPC1に出力するものとする。
なお、本例においては、スキャナがネットワークと接続される構成について説明するが、PC1あるいはPC2と接続され、PC1あるいはPC2を介して電子化文書を送信する構成とすることも可能である。
スキャナSCN1は、原稿を読取って、読取った文書画像に含まれる文書要素の文書画像内の位置を示す情報と、当該文書要素の種別を示す情報とを含む属性情報を生成する。そして、読取った文書画像に属性情報を付加して電子化文書を生成する。代表的に電子化文書にはPDF(Portable Document Format)等のフォーマットを採用することができる。
この「文書要素」とは、文書を構成する記述要素を意味する。なお、このような属性情報は、「メタ情報(meta data)」とも称され、上述のような位置および種別を示す情報に加えて、たとえば各文書要素を代表する説明などを含めてもよい。以下の説明では属性情報の代表例として「しおり」を電子化文書に付加する構成について説明する。なお、本明細書においては、「属性情報」とは、文書要素の「文書画像内の位置」を示す情報と、当該文書要素の「種別」を示す情報とを少なくとも含むデータであり、「しおり」の他に文書要素についての補足的コメントをさらに含む「注釈」あるいは「スレッド」あるいは「アウトライン」等であってもよい。
なお、スキャナSCN2についても同様である。
スキャナSCN1により生成された電子化文書は、ネットワークを介してPC1に送信されて、PC1の記憶部に格納される。また、ネットワークを介して他のPC等に送信される。
なお、スキャナSCN1は、図示しないが原稿をセットするための載荷台と、原稿台ガラスと、載荷台に設置された原稿を原稿台ガラスに自動的に1枚ずつ搬送する搬送部と、読取られた原稿を排出するための排出台とを含む。これにより、複数枚の原稿を連続的に読取って、1つの電子化文書として生成することができる。
図2は、本発明の実施の形態に従うPCの概略構成図である。
図2を参照して、本発明の実施の形態に従うPCは、オペレーティングシステム(OS:Operating System)を含む各種プログラムを実行するCPU(Central Processing Unit)201と、代表的にDRAM(Dynamic Random Access Memory)など揮発性の記憶装置であり、CPU201でのプログラムの実行に必要なデータを一時的に記憶するメモリ部213と、CPU201で実行されるプログラムを不揮発的に記憶するハードディスク部(HDD:Hard Disk Drive)211とを含む。また、PCは、ネットワークで接続された通信インターフェイス部207と、マウスおよびキーボード等を含む入力部209と、液晶ディスプレイ等を含む表示部205とを含む。
本発明の実施の形態に従う文書処理装置は、代表的にCPU等の演算装置から構成され、HDD211等に格納されているアプリケーション等を実行することにより実現される。
このようなアプリケーションは、一般的にFDDドライブ217またはCD−ROMドライブ215を介してそれぞれフレキシブルディスク217aあるいはCD−ROM(Compact Disk-Read Only Memory)215aから読取られてHDD211に格納される。もしくはネットワーク配信されるアプリケーションを通信インターフェイス部207を介して受信しHDD211に格納することも可能である。
CPU201は、キーボードやマウス等からなる入力部209を介して利用者からの指示を受けるとともにプログラムの実行において生成される画面表示を表示部205へ出力する。具体的には、CPU201は、表示部205に本発明に係る文書処理装置における文書閲覧画面を表示する。
また、CPU201は、LANカード等からなる通信インターフェイス部207を介してLANやWANに接続されたスキャナSCN1,SCN2(以下、総称してスキャナSCNとも称する)あるいはサーバ装置SRVあるいは他のPC(たとえばPC2等)から電子化文書を取得してメモリ部213に格納する。また、上述の各部は内部バス203を介して相互にデータを授受する。
通信インターフェイス部207は、代表的にはネットワーク(たとえばLAN)を介してPC等との間でデータを送受信するための部位であり、たとえばLANアダプタおよびそれを制御するドライバソフト等を含む。
図3は、本発明の実施の形態に従う文書処理方法を実現するためのスキャナSCNおよびPCのブロック構成図である。
まず、スキャナSCNの構成について説明する。
スキャナSCNは、画像読取部3と、デジタル画像生成部4と、画像データ記憶部5と、文書要素抽出部2と、圧縮処理部6と、電子化文書生成部7と、しおりデータ生成部8と、送信部1とを含む。
画像読取部3は、紙原稿を読取って文書画像を取得し、その文書画像をデジタル画像生成部4に出力する。デジタル画像生成部4は、主としてパーソナルコンピュータPC等での表示に適するように文書画像の表示特性を調整する。また、文書画像に含まれるノイズを除去することも可能である。
そしてデジタル画像生成部4で処理された文書画像のデータは画像データ記憶部5に送られる。
画像データ記憶部5は、取得された文書画像のデータを一時的に格納する部位であり、一旦格納した文書画像を圧縮処理部6および文書要素抽出部2に出力する。
圧縮処理部6は、画像データ記憶部5から出力される文書画像を圧縮処理して電子化文書生成部7へ出力する。この圧縮処理による圧縮度合は、生成される電子化文書の大きさや要求される文書画像の解像度などに応じて変化させてもよく、また圧縮処理はJPEG(Joint Photographic Experts Group)などの非可逆変換であってもよい。
なお、高解像度が要求されるような場合には圧縮処理を省略することもできる。
文書要素抽出部2は、画像データ記憶部5から出力される文書画像に含まれる所定の種別の文書要素を抽出する。文書要素抽出部2は、この文書要素の抽出に際して、各文書要素の文書画像内における位置も抽出する。そして文書要素抽出部2は、抽出した文書要素の種別およびその位置情報をしおりデータ生成部8に出力する。
文書画像に含まれる文書要素の抽出処理について説明すると、文書要素の抽出については公知の方法を用いることができるが、代表的に文字サイズや隣接する領域に対する間隔などに基づいて、各領域が抽出される。たとえば具体的には、「表題(タイトル)」は、文書画像内に配置される文字の文字サイズに基づいて抽出することができる。「見出し」は、文書画像内におけるオフセット位置やインデント位置などに基づいて抽出することができる。
なお、文書要素として抽出する種別は、上述のものに限られることはなく公知の認識技術を用いてさまざまな種別の文書要素を抽出することも可能である。
しおりデータ生成部8は、文書要素抽出部2から出力される文書要素の文書画像内の位置情報と種別とに基づいて属性情報である後述するしおりデータを生成する。そしてしおりデータ生成部8は、生成したしおりデータを電子化文書生成部7へ出力する。
電子化文書生成部7は、圧縮処理部6からの(圧縮された)文書画像にしおりデータ生成部8からのしおりデータを付加することで電子化文書を生成する。
出力部1は、しおりデータと画像データから閲覧に適したファイル形式に変換し、変換したファイルデータを各種の通信プロトコルに従って本例においてはPC201に出力する。次にPC201の構成について説明する。
PC201は、入力部に含まれるマウス等のポインティングデバイスの操作指示に従ってI/O部18からの入力データの入力を受け付けて、入力された操作指示内容を検知するマウス指定座標検知部14と、スキャナSCNからの電子化文書の入力を受けてPDFファイルデータから画像データおよびしおりデータを分離した後にメモリ部213の記憶部にそれぞれ出力する文書入力部9と、メモリ部213に入力されたしおりデータをそれぞれ対応付ける閲覧情報対応決定部15と、マウスの操作入力に従って指示された内容に基づいてメモリ部213に格納された画像データを参照して、しおりデータに対応する画像データを表示部205に出力する表示制御部19とを含む。また、表示制御部19は、必要に応じてしおりデータに基づいてしおり一覧を生成して表示部205に表示する。
図4は、電子化文書生成部7が生成する電子化文書のデータ構造の一例を示す図である。
図4(a)を参照して、電子化文書400は、ヘッダ部402と、本体部404と、しおりデータ部405と、フッタ部406とから構成される。
ヘッダ部402およびフッタ部406には電子化文書の属性についての情報、たとえば作成日時・作成者・著作権情報等が格納される。
本体部404は、各ページに対応する文書画像が格納される。また、しおりデータ部405には、属性情報である文書画像に含まれる文書要素を特定するための生成されたしおりデータが格納される。
図4(b)に示されるように、複数のページデータとしおりデータがあり、ページツリーとしおり階層を介してドキュメントカテゴリの下に配置される構成を取る。具体的には、ページツリーにページ間の順序が記述される。なお、本例におけるしおりデータは、後述するがしおりIDと、しおりタイトル、対象に関する記述としおりデータ間の関係に関する記述を含む。
図5は、本発明の実施の形態1に従う文書処理装置で処理される第1および第2の文書画像の具体例を説明する図である。
図5(a)を参照して、ここでは第1の文書画像が示されている。第1の文書画像は、3ページの文書画像で構成されている。そして、第1の文書画像において、文書要素500〜505が特定された場合が示されている。具体的には、「報告書A」の文書要素500、「第1章」の文書要素501、「第2章」の文書要素502、「第3章」の文書要素503、「第4章」の文書要素504、「第5章」の文書要素505が示されている。
図5(b)を参照して、ここでは第2の文書画像が示されている。第2の文書画像は、4ページの文書画像で構成されている。そして、第2の文書画像において、文書要素510〜515が特定された場合が示されている。具体的には、「報告書A」の文書要素510、「第1章」の文書要素511、「第2章」の文書要素512、「第3章」の文書要素513、「第4章」の文書要素514、「第5章」の文書要素515が示されている。
図6は、本発明の実施の形態1に従うしおりデータのデータ構造の一例を説明する図である。
図6(a)には、第1の文書画像において、特定された文書要素500〜505に基づいて第1の文書画像のしおりデータの一覧が示されている。
また、図6(b)には、第2の文書画像において、特定された文書要素510〜515に基づいて第2の文書画像のしおりデータの一覧が示されている。
具体的には、各文書要素に対応付けて、しおりデータの出現順序を規定する「しおりID」、対応する文書要素の種別(名称)を特定する「しおりタイトル」、そして、対応するしおりデータの前後のしおりデータのID情報(「前後のしおり」)、そして、識別されたページ(「ページ識別」)と「座標」とが格納される。なお、ここでは、文書要素の種別として「title」、「1.0」・・・等が示されており、「title」は、表題を意味する。また、「1.0」・・・等は、見出しを意味するものとする。
「ページ識別」は、対応する文書要素が存在する文書画像におけるページを特定するための位置情報である。また、「座標」(left, bottom, right, top)は、対応する文書要素のページ内での領域(矩形)を特定するための位置情報である。
具体的には、第1の文書画像において、「報告書A」の文書要素500は、「しおりID」が「1」、「しおりタイトル」が「title」、「前後のしおり」が「_,2」、「ページ識別」が「1」、「座標」が「X11,Y11,X12,Y12」として記述されている。なお、「前後のしおり」の「_」の記号はnull記号であり前後に何もIDが無いことを指し示すものである。「第1章」の文書要素501は、「しおりID」が「2」、「しおりタイトル」が「1.0」、「前後のしおり」が「1,3」、「ページ識別」が「1」、「座標」が「X21,Y21,X22,Y22」として記述されている。以下、同様にして、しおりデータが記述されている。第2の文書画像についても同様である。
図7は、本発明の実施の形態1に従う文書処理装置の文書処理方法を説明する図である。
なお、本例においては、一例として、上記で説明した第1および第2の文書画像を例に挙げた文書処理方法について説明する。
図7を参照して、まずマウス操作があるかどうかを判断する(ステップS1)。具体的には、表示制御部19は、マウス指定座標検知部14を介する図3で説明したマウス3の操作に基づくI/O部18からの操作に従う入力データが有るかどうかを判断する。無ければ、ステップS1を維持する。
次に、マウス3が後述するしおり一覧の上にあるか否かを判断する(ステップS2)。
具体的には、表示制御部19は、マウス指定座標検知部14を介するI/O部18からの操作に従う入力データに従ってマウスの指定座標がしおり一覧上の領域内であるか否かを判断する。無ければ、ステップS1に戻る。なお、しおり一覧は、表示制御部19により上述したしおりデータの一覧に基づいて生成され、しおり一覧に示されるしおりは、しおりIDと対応付けられているものとする。
次に、表示制御部19は、マウス指定座標検知部14を介してマウス3をクリックしたかどうかを判断する(ステップS3)。具体的には、マウス3の指定座標がしおり一覧上にあって、マウス3によりしおりをクリックした場合には、次のステップに進み、第1の画像データ記憶部10からクリックされたしおりを含む表示データを生成する(ステップS4)。一方、クリックされない場合には、最初のステップS1に戻る。
そして、次にクリックされたしおりに対応する第2の文書画像のしおりを判定する(ステップS5)。具体的には、表示制御部19は、閲覧情報対応決定部15に対してしおりデータの対応付けを実行するように指示する。そして、閲覧情報対応決定部15において、しおりデータの対応付けが実行されてその結果が表示制御部19に出力される。
クリックされたしおりに対応する第2の文書画像のしおりを判定する方式すなわちしおりデータの対応付けを実行する方式については後述する。
そして、次に対応するしおりを含む第2の画像データ記憶部13から表示データを生成する(ステップS6)。
そして、文書閲覧画面における第1の文書画像の表示を更新する(ステップS7)。
次に、文書閲覧画面における第2の文書画像の表示を更新する(ステップS8)。そして終了する。
次に、本発明の実施の形態1に従う第1のしおりデータと、第2のしおりデータとの対応付けについて説明する。なお、第1のしおりデータと第2のしおりデータとの対応付けは、表示制御部19からの指示に従って閲覧情報対応決定部15で実行されるものとする。
図8は、本発明の実施の形態1に従う第2の画像データのしおりを判定するフロー図である。
図8を参照して、まずクリックされた第1の文書画像のしおりIDを取得する(ステップS10)。具体的には、しおり一覧上にあって、しおりは、上述したように対応するしおりIDと対応付けられており、しおりをクリックした場合には、閲覧情報対応決定部15は、表示制御部19から対応するしおりIDを取得する。
そして、次に閲覧情報対応決定部15は、第1のしおりデータ記憶部11を参照して、対応するしおりIDのデータを取得する(ステップS11)。具体的には、第1のしおりデータ記憶部11から取得されたしおりIDに基づくデータを取得する。例えば、しおり一覧において、「title」をマウスでクリックした場合には、「title」に対応するしおりID「1」が取得され、しおりID「1」に対応するデータを取得する。
そして、次に閲覧情報対応決定部15は、第2のしおりデータ記憶部12を参照して、クリックしたしおりタイトルと同一のしおりタイトルを持つしおりを検索する(ステップS12)。
例えば、第1の画像データの「title」をマウスでクリックした場合には、第2のしおりデータを参照して、「title」のしおりが検索される。
そして、次に同一のしおりタイトルを持つしおりがあるかどうかを判断する(ステップS13)。
同一のしおりタイトルを持つしおりがある場合には、次にその数が1つかどうかを判断する(ステップS19)。
同一のしおりタイトルを持つしおりが1つである場合には、検索されたしおりIDを出力する(ステップS20)。
例えば、第1の画像データの「title」をマウスでクリックした場合には、第2のしおりデータを参照して、「title」のしおりを検索して、閲覧情報対応決定部15は、表示制御部19にステップS13およびステップS19を介して、検索されたしおりのしおりIDである「1」を出力する。
一方、ステップS19において同一のしおりタイトルを持つしおりが複数ある場合にはステップS21に進み、第1のしおりデータ記憶部11を参照して、クリックしたしおりタイトルと同一のしおりを検索する(ステップS21)。
例えば、第2のしおりデータにクリックしたしおりタイトルと同一の複数のしおりタイトルが含まれているような場合には、しおりの出現順に従って対応するしおりIDを特定する。
まず、ステップS21で検索した結果、第1のしおりデータを参照して、クリックしたしおりタイトルが複数存在するか否か、すなわちその数が1つかどうかを判断する(ステップS22)。
ステップS22において、その数が1つである場合には、第2のしおりデータを参照して、ページ識別と座標から検索されたしおりIDの出現順を特定する(ステップS23)。
そして、次に先に現れるしおりのしおりIDを出力する(ステップS24)。
例えば、第1のしおりデータには、クリックしたタイトルと同一のしおりタイトルが1つであり、第2のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数含まれるような場合に相当する。当該場合には、第2のしおりデータを参照して、同一のしおりタイトルのしおりIDの出現順を特定して、第1のしおりデータのクリックしたタイトルのしおりIDと第2のしおりデータの先に現れるしおりIDとの対応付けを実行するものである。
ステップS22においてその数が1つではない場合すなわち複数ある場合には、第1のしおりデータを参照してページ識別と座標からしおりIDの出現順を特定する(ステップS25)。
そして、次に第2のしおりデータを参照してページ識別と座標からしおりIDと出現順が同じしおりIDを特定する(ステップS26)。
そして出現順が同じあるいは近いしおりのしおりIDを出力する(ステップS27)。
例えば、第1のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数(2つ)あり、第2のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数(2つ)含まれるような場合に相当する。当該場合には、第1のしおりデータを参照して、同一のしおりタイトルのしおりIDの出現順を特定する。そして、第2のしおりデータを参照して、同一のしおりタイトルのしおりIDの出現順を特定する。
そして、出現順が同じしおりIDを出力することになる。
なお、第1のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数あり、第2のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数含まれるような場合にそれぞれ同数あるいは第2のしおりデータの個数が多い場合には、出現順に従って付けることが可能であるが、第1のしおりデータの個数が多い場合には、出現順が同じしおりIDを常に対応付けることができない。
例えば、第1のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数(3つ)あり、第2のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数(2つ)含まれるような場合に相当する。当該場合には、第1のしおりデータの最初の2つのしおりタイトルについて出現順に従って第2のしおりデータと対応付けることが可能であるが、最後のしおりタイトルについては、出現順に従って対応付ける第2のしおりデータのしおりタイトルが無いため、係る場合には、第2のしおりデータの最後のしおりタイトルと対応付けることととする。すなわち、出現順が近いしおりIDと対応付けられて出力されるものとする。
ステップS13において、同一のしおりタイトルを持つしおりがない場合には、第1のしおりデータを参照して、しおりIDの前後のしおりIDを出力する(ステップS14)。
例えば、第2のしおりデータにクリックしたしおりタイトルと同一のしおりタイトルが含まれていないような場合には、クリックしたしおりタイトルに対応するしおりIDの前後のしおりIDの情報に基づいて、第2のしおりデータにおける対応するしおりIDを特定する。
そして、前のしおりIDのデータを取得してしおりIDと置き換える(ステップS15)。
例えば、第1の画像データのしおりタイトル「2.0」をマウスでクリックした場合に、第2のしおりデータを参照して、同一のしおりタイトルを検索して、同一のしおりタイトルが無いと仮定すると、しおりデータの「前後のしおり」からしおりID「1,3」を取得する。前のしおりID「1」と置き換える。
次に、同一のしおりタイトルを持つしおりがあるかどうかを判断する(ステップS16)。
すなわち、第2のしおりデータにおいて、置き換えたしおりIDに対応するしおりタイトルと同一のしおりタイトルを持つしおりがあるかどうかを判断する。
そして、ステップS16において、同一のしおりタイトルを持つしおりがある場合にはステップS19に進み、その後の処理については上述したのと同様であるのでその詳細な説明は繰り返さない。すなわち、この場合には、クリックしたしおりタイトルと同一のしおりタイトルを第2のしおりデータが有していない場合には、前のしおりIDのしおりタイトルと同一のしおりタイトルを第2のしおりデータが有しているか検索して、しおりIDを特定するものである。
一方、ステップS16において同一のしおりタイトルを持つしおりがない場合には、後のしおりIDのデータを取得してしおりIDと置き換える(ステップS17)。
例えば、第1の画像データのしおりタイトル「2.0」をマウスでクリックした場合に、第2のしおりデータを参照して、同一のしおりタイトルを検索して、同一のしおりタイトルが無いと仮定すると、しおりデータの「前後のしおり」からしおりID「1,3」を取得する。そして、ステップS16において、前のしおりID「1」と同一のしおりタイトルが無い場合には、後のしおりID「3」と置き換える。
次に、同一のしおりタイトルを持つしおりがあるかどうかを判断する(ステップS18)。
すなわち、第2のしおりデータにおいて、置き換えたしおりIDに対応するしおりタイトルと同一のしおりタイトルを持つしおりがあるかどうかを判断する。
そして、ステップS18において、同一のしおりタイトルを持つしおりがある場合にはステップS19に進み、その後の処理については上述したのと同様であるのでその詳細な説明は繰り返さない。すなわち、この場合には、クリックしたしおりタイトルと同一のしおりタイトルを第2のしおりデータが有していない場合には、後のしおりIDのしおりタイトルと同一のしおりタイトルを第2のしおりデータが有しているか検索して、しおりIDを特定するものである。
一方、ステップS18において、同一のしおりタイトルを持つしおりがない場合には、しおりID(置換前)のページ識別と座標を取得する(ステップS28)。
しおりIDの前後のしおりIDに対応するしおりタイトルと同一のしおりタイトルがない場合には、クリックしたしおりタイトルに対応するページ識別と座標の情報に基づいて、第2のしおりデータにおける対応するしおりIDを特定する。
まず、第2のしおりデータ記憶部を参照して、同じページ識別を持つしおりを検索する(ステップS29)。
そして、同じページ識別のしおりがあるかどうかを判断する(ステップS30)。
第2のしおりデータを参照して、同じページ識別を持つしおりがある場合にはその数が1つかどうかを判断する(ステップS31)。
その数が1つである場合には検索されたしおりのしおりIDを出力する(ステップS32)。
しおりIDの前後のしおりIDに対応するしおりタイトルと同一のしおりタイトルがない場合には、クリックしたしおりタイトルのしおりデータのページ識別と同じページ識別を持つしおりIDと対応付けることとする。
一方、ステップS31において、その数が複数ある場合には座標が最も近いしおりを算出する(ステップS33)。
算出されたしおりのしおりIDを出力する(ステップS34)。
具体的には、クリックしたしおりタイトルに対応するページ識別と座標の情報に基づいて、座標間の距離を算出することにより、第2のしおりデータにおける最も近いしおりを算出して、算出されたしおりIDと対応付けることとする。
一方、ステップS30において、同じページ識別のしおりがない場合には、第2のしおりデータ記憶部を参照して、最後尾のしおりを検索する(ステップS35)。
そして、検索されたしおりのしおりIDを出力する(ステップS36)。
すなわち、第2のしおりデータにおいて、同じページ識別のしおりが無い場合には、第2のしおりデータのページが第1のしおりデータに比べて少ない可能性が高いため当該場合には、最後尾のしおりが最も近いしおりであると考えられるため最後尾のしおりのしおりIDと対応付けることとする。
図9は、図5および図6で説明した第1および第2の文書画像において、しおり一覧をマウスにより指定した場合の画面表示の例について説明する図である。
図9(a)においては、表示部205に表示された文書閲覧画面において、報告書FAのタイトルが付された第1の文書画像の表示領域600と、報告書FA#のタイトルが付された第2の文書画像の表示領域610とが設けられている場合が示されている。
そして、表示領域600には、第1の文書画像のしおりデータのしおり一覧602と、画像データ表示領域604とが示されている。また、表示領域610には、第2の文書画像のしおりデータのしおり一覧612と、画像データ表示領域614とが示されている。
そして、しおり一覧602の「4.0」をマウスにより指定した場合の画面が表示されている。
第1の文書画像のしおり一覧602の「4.0」をマウスにより指定した場合においては、図7のステップS4において、表示制御部19は、第1の画像データ記憶部10からクリックされた「4.0」のしおりを含む表示データを生成する。具体的には、第1の画像データ記憶部10を参照して、クリックしたしおりが含まれるページ識別「2」の画像データを生成する。
そして、次に、ステップS5において、クリックされたしおりに対応する第2の画像データのしおりを判定する。
この場合、しおり一覧602の「4.0」をマウスにより指定した場合、表示制御部19は、しおりID「5」を取得する。そして、閲覧情報対応決定部15に対してしおりID「5」を出力する。閲覧情報対応決定部15は、クリックされたしおりに対応する第2の文書画像のしおりを判定する。
具体的には、図8のフローに従って、第2のしおりデータ記憶部12を参照して、クリックしたしおりタイトルと同一のしおりタイトルを持つしおりを検索し、検索されたしおりタイトル「4.0」に対応するしおりID「5」を出力する。
そして、ステップS6において、第2の画像データ記憶部13から対応するしおりであるしおりタイトル「第4章」を含む表示データを生成する。
そして、ステップS7,S8において、文書閲覧画面における第1および第2の画像データの表示が更新される。
なお、図9(a)においては、表示制御部19は、しおりタイトル「4.0」について強調表示するとともに、「第4章」の部分が矩形領域で囲むことにより強調表示している場合が示されている。なお、当該矩形領域部分の表示色を他の領域の色と変更して赤色等の判別し易い色で表示することも可能である。
図9(b)においては、第1の文書画像のしおり一覧602の「2.0」をマウスにより指定した場合の画面が表示されている。
第1の文書画像のしおり一覧602の「2.0」をマウスにより指定した場合においては、図7のステップS4において、表示制御部19は、第1の画像データ記憶部10からクリックされた「2.0」のしおりを含む表示データを生成する。具体的には、第1の画像データ記憶部10を参照して、クリックしたしおりが含まれるページ識別「1」の画像データを生成する。
そして、次に、図7のステップS5において、クリックされたしおりに対応する第2の文書画像のしおりが判定される。
この場合、しおり一覧602の「2.0」をマウスにより指定した場合、しおりID「3」が取得される。
そして、第2のしおりデータ記憶部12を参照して、クリックしたしおりタイトルと同一のしおりタイトルを持つしおりを検索し、検索されたしおりタイトル「2.0」に対応するしおりID「3」を出力する。
そして、図7のステップS6において第2の画像データ記憶部13から対応するしおりであるしおりタイトル「第2章」を含む表示データを生成する。
そして、ステップS7,S8において、第1および第2の画像データの表示が更新される。
図9(c)においては、第1の文書画像のしおり一覧602の「title」をマウスにより指定した場合の画面が表示されている。
第1の文書画像のしおり一覧602の「title」をマウスにより指定した場合においては、図7のステップS4において、表示制御部19は、第1の画像データ記憶部10からクリックされた「title」のしおりを含む表示データを生成する。具体的には、第1の画像データ記憶部10を参照して、クリックしたしおりが含まれるページ識別「1」の画像データを生成する。
そして、次に、図7のステップS5において、クリックされたしおりに対応する第2の文書画像のしおりが判定される。
この場合、しおり一覧602の「title」をマウスにより指定した場合、図8を参照して、しおりID「1」が取得される。
そして、第2のしおりデータ記憶部12を参照して、クリックしたしおりタイトルと同一のしおりタイトルを持つしおりを検索し、検索されたしおりタイトル「title」に対応するしおりID「1」を出力する。
そして、図7のステップS6において第2の画像データ記憶部13から対応するしおりであるしおりタイトル「報告書A」を含む表示データを生成する。
そして、ステップS7,S8において、第1および第2の画像データの表示が更新される。
当該方式により、マウス操作により、文書閲覧画面における第1の文書画像のしおりをクリックすることにより、閲覧情報対応決定部15において第1の文書画像のしおりデータと第2の文書画像のしおりデータとの対応付けが実行されて、第2の文書画像の対応するしおりが含まれる箇所を自動的に表示して参照することができるので、少ない操作で適格に該当箇所の比較を実行することが可能である。
また、本例においては、文書閲覧画面における第1の文書画像のしおりをクリックすることにより、第2の文書画像の対応するしおりが含まれる箇所が表示される方式について説明したが、反対に文書閲覧画面における第2の文書画像のしおりをクリックすることにより第1の文書画像の対応するしおりが含まれる箇所を表示させることも当然に可能である。
なお、指定するマウスの座標に従って対応付けの関係を切り替えることも可能である。例えば、第1の文書画像のしおり一覧をクリックした場合には、クリックした第1の文書画像のしおりに対応するしおりが含まれる第2の文書画像を表示し、第2の文書画像のしおり一覧をクリックした場合には、クリックした第2の文書画像のしおりに対応するしおりが含まれる第1の文書画像を表示させるようにすることも可能である。
また、本例においては、第1および第2の文書画像を表示する場合について説明しているが、特に2つに限られず、さらに複数の文書画像を表示させるようにすることも可能である。具体的には、メモリ部213に複数の文書画像にそれぞれ対応して画像データ記憶部およびしおりデータ記憶部を設けて閲覧情報対応決定部15においてしおり判定を実行することにより実現可能である。なお、この場合、マウスによりしおり一覧をクリックした対応する文書画像が第1の文書画像に相当し、それ以外の複数の文書画像の各々が第2の文書画像に相当する。
(実施の形態1の変形例1)
また、本発明の実施の形態1においては、単一の文書画像のしおり一覧をそれぞれ作成して表示する構成であったが、同時に表示する複数の文書画像のしおり一覧を統合して1つのしおり一覧を作成することも可能である。
図10は、本発明の実施の形態1の変形例に従う画面を説明する図である。
図10を参照して、本例においては、表示部205に表示された文書閲覧画面において、報告書FAのタイトルが付された第1の文書画像の表示領域700と、報告書FA#のタイトルが付された第2の文書画像の表示領域710とが設けられている場合が示されている。
そして、表示領域700には、第1の文書画像の画像データ表示領域702が示されている。また、表示領域710には、第2の文書画像の画像データ表示領域712が示されている。
そして、第1の文書画像および第2の文書画像のしおりデータについて一括してしおり一覧714が設けられている場合が示されている。
なお、この場合同じしおりタイトルが複数現れることが考えられるが、このような重複したしおりタイトルを除いて表示することも可能であるし、文書画像の識別子等を付加することで区別することも可能である。
(実施の形態1の変形例2)
また、上記の実施の形態1においては1ページ相当を画面にそれぞれ表示する構成としていたが、たとえば第1の文書画像以外は対応するしおり部分のみを表示する構成とすることも可能である。
図11は、本発明の実施の形態1の変形例2に従う画面表示を説明する図である。
図11を参照して、本例においては、表示部205に表示された文書閲覧画面において、報告書FAのタイトルが付された第1の文書画像の表示領域800が示されている。
そして、表示領域800には、第1の文書画像のしおりデータのしおり一覧802と、画像データ表示領域804とが示されている。また、報告書FA#のタイトルが付された第2の文書画像の表示領域810と、報告書FBのタイトルが付された第3の文書画像の表示領域822と、報告書FCのタイトルが付された第4の文書画像の表示領域824とが示されている。
そして、ここでは第1の文書画像のしおり一覧802において「4.0」がマウスにより指定された場合に、第2および第3および第4の文書画像において、対応するしおり部分のみが拡大されて表示されている場合がそれぞれ示されている。
具体的には、第1の文書画像が表示される画面802において、しおり「4.0」に対応する画面表示がなされるとともに、第2〜第4の文書画像が表示される画面810,822,824において、対応するしおり部分である「第4章」、「4.新体制」、「第4新体制」という標記で一例としてそれぞれ示されている。
当該方式により、複数の文書画像のしおり部分のタイトルの比較を簡易に実行することが可能である。
(実施の形態2)
また上記の実施の形態1においては、選択された第1の文書画像のしおりと、第2の文書画像の既存のしおりとを対応付ける方式について説明したが、第2の文書画像に対して表示用の新規のしおりを新たに生成するようにすることも可能である。
たとえば、図8のステップS13において、同一のしおりタイトルを持つしおりが無いと判定された場合には、対応するしおりタイトルの前後のしおりIDに対応する第2のしおりデータと同じしおりがあるか否かを判定して、存在する場合には、それらのしおりの位置の中間に表示用の新規のしおりデータを生成して、しおりIDと対応付けることも可能である。
図12は、本発明の実施の形態2に従う第2の画像データのしおりを判定するフロー図である。
図12を参照して、図8と比較して、ステップS40〜ステップS42をさらに追加した点が異なる。その他の点については同様であるのでその詳細な説明は繰り返さない。
ステップS40において、第2のしおりデータを参照して、取得した前後のしおりIDに対応するしおりタイトルと同一のしおりタイトルがあるか判定する。
ステップS40において、同一のしおりタイトルがある場合には、しおりを作成する(ステップS41)。具体的には、前後のしおりIDに対応するしおりタイトルと同一のしおりタイトルの間の中間に新規のしおりを作成する。
そして、生成したしおりのしおりIDを出力する(ステップS42)。
一方、ステップS40において、同一のしおりタイトルが無い場合には、ステップS15に進む。以降の処理については同様であるのでその詳細な説明は繰り返さない。
すなわち、同一のしおりタイトルを持つしおりが無いと判定された場合に、対応するしおりタイトルの前後のしおりIDに対応する第2のしおりデータと同じしおりがある場合には、その中間に新規のしおりを生成して、当該しおりと対応付けることとする。
図13は、本発明の実施の形態3に従う新規のしおりの生成について説明する図である。
図13を参照して、本例においては、第1の文書画像においてしおりIDがB1〜B3のしおりデータが存在する場合に、第2の文書画像のしおりIDと対応付ける場合の例について説明する。ここで、始め第2の文書画像のしおりIDは、C1,C2のしおりデータのみとする。
第1の文書画像において、しおりIDがB2である「第1.1章」がマウスにより指定された場合、第2の文書画像には、「第1.1章」と同じしおりタイトルは無いため図12のステップS13において、「NO」となる。そして、ステップS14において、第1のしおりデータ記憶部を参照して、しおりIDの前後のしおりIDを取得する。本例においては、しおりIDとしてB1,B3が取得される。
そして、次に、ステップS40において、第2のしおりデータ記憶部を参照して、取得した前後のしおりIDに対応するしおりタイトルと同一のしおりタイトルがあるかどうかを判定する。
そして、本例においては、第2の文書画像において、しおりIDとしてB1,B3に対応するしおりタイトルと同一のしおりタイトルがあるためステップS41に進み、新たなしおりを作成する。
具体的には、第2の文書画像のしおりIDのC1とC2のしおりデータから中間の位置にしおりIDがDであるしおりを生成する。
これにより、第1の文書画像のしおりIDがB2である「第1.1章」について、第2の文書画像において、新たに中間に設けられたしおりIDがDであるしおりと対応付けられるため、実施の形態1の場合には対応付けが的確にできないような場合であっても、対応付けられる可能性の高い箇所の比較を簡易に行なうことができる。
(実施の形態3)
また上記の実施の形態においては、マウスからのクリック操作が行なわれたタイミングで選択された第1の文書画像の1つのしおりと、第2の文書画像におけるしおりデータの1つとを対応付ける方式であったが、第1の文書画像のしおりが選択可能であれば他の方法を用いることも可能である。
図14は、本発明の実施の形態3に従う画面表示を説明する図である。
本発明の実施の形態3に従う方式においては、スクロールバー920を用いて第1の文書画像の1つのしおりと、第2の文書画像におけるしおりデータの1つとを対応付ける方式について説明する。
図14を参照して、本例においては、表示部205に表示された文書閲覧画面において、報告書FAのタイトルが付された第1の文書画像の表示領域900が示されている。
そして、表示領域900には、画像データ表示領域902と、スクロールバー920とが示されている。また、報告書FA#のタイトルが付された第2の文書画像の表示領域910が示されている。
たとえばスクロールバー920はマウスやキーボード等を用いて操作可能であり、第1の文書画像の表示領域を移動させることができる。そして、本例においては、表示領域内の最上位のしおりが選択されたしおりであるものとして、第2の画像のしおりデータと対応付けることとする。
具体的には、マウス指定座標検知部14は、スクロールバー920のバーの位置を検知して表示制御部19に出力する。表示制御部19は、スクロールバー920のバーの位置に従って第1の画像データ記憶部10の画像データを参照して表示領域に表示するとともに、当該表示領域に表示されている画像データに含まれている最上位のしおりが指定されたしおり(すなわちクリックされたしおり)であると判断する。そして、指定されたしおりに対応する第2の画像データのしおりを判定し、第2の画像データ記憶部から対応するしおりを含む表示データを生成する。以降の処理については図7で説明した方式と同様であるのでその詳細な説明は繰り返さない。
本発明の実施の形態3に従う方式においては、しおり一覧をマウスを用いて指定するのではなく、スクロールバー920を用いて表示領域内の最上位のしおりが指定されたものとして判断することにより、第1の文書画像の表示領域の移動に伴って、第2の文書画像の表示領域の移動も連続的に実行されるためスムーズな比較判断を実行することが可能である。
また、上記の実施の形態においては、マウスからのクリック操作等が行なわれたタイミングで、選択された1つのしおりに対する第2のしおりデータの1つを対応付けるものであったが、電子化文書が入力された時点で第1のしおりデータと第2のしおりデータとを対応付けて、その結果をメモリ部に記憶させることも可能である。
当該場合には、メモリ部に記憶された対応付けられたしおりデータを用いて表示制御部19が表示制御を実行することができるため、マウス操作が行なわれたタイミングで予め定められたメモリ部に記憶されている結果を参照することにより、マウス操作に対する画面の更新を高速化させることが可能である。
なお、上記した文書処理装置は、例えば、あるオフィスの利用者と、別のオフィスにある利用者とが各々別々に作成した文書を比較しながら会議を行なうような遠隔会議システムと組み合わせて使用することも可能である。
なお、コンピュータを機能させて、上述のフローで説明したような制御を実行させるプログラムを提供することもできる。このようなプログラムは、コンピュータに付属するフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)およびメモリカードなどのコンピュータ読取り可能な記録媒体にて記録させて、プログラム製品として提供することもできる。あるいは、コンピュータに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
なお、本発明にかかるプログラムは、コンピュータのオペレーションシステム(OS)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかるプログラムに含まれ得る。
また、本発明にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストール
されて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記録された記録媒体とを含む。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明の実施の形態に従う文書処理装置を含むシステムの概略構成図である。 本発明の実施の形態に従うPCの概略構成図である。 本発明の実施の形態に従う文書処理方法を実現するためのスキャナSCNおよびPCのブロック構成図である。 電子化文書生成部7が生成する電子化文書のデータ構造の一例を示す図である。 本発明の実施の形態1に従う文書処理装置で処理される第1および第2の文書画像の具体例を説明する図である。 本発明の実施の形態1に従うしおりデータのデータ構造の一例を説明する図である。 本発明の実施の形態1に従う文書処理装置の文書処理方法を説明する図である。 本発明の実施の形態1に従う第2の画像データのしおりを判定するフロー図である。 図5および図6で説明した第1および第2の文書画像において、しおり一覧をマウスにより指定した場合の画面表示の例について説明する図である。 本発明の実施の形態1の変形例に従う画面を説明する図である。 本発明の実施の形態1の変形例2に従う画面表示を説明する図である。 本発明の実施の形態2に従う第2の画像データのしおりを判定するフロー図である。 本発明の実施の形態3に従う新規のしおりの生成について説明する図である。 本発明の実施の形態3に従う画面表示を説明する図である。
符号の説明
1 送信部、2 文書要素抽出部、3 画像読取部、4 デジタル画像生成部、5 画像データ記憶部、6 圧縮処理部、7 電子化文書生成部、8 しおりデータ生成部、9 文書入力部、10 第1の画像データ記憶部、11 第1のしおりデータ記憶部、12 第2のしおりデータ記憶部、13 第2の画像データ記憶部、14 マウス指定座標検知部、15 閲覧情報対応決定部、17 マウス、18 I/O部、19 表示制御部、201 CPU、203 内部バス、205 表示部、207 通信インターフェイス部、209 入力部、211 HDD、213 メモリ部、215 CD−ROMドライブ、217 FDDドライブ。

Claims (5)

  1. 電子化文書は、文書画像と文書画像内での内容領域の位置を示す閲覧情報とを含み、
    前記閲覧情報は、文章画像内での少なくとも1つの内容領域に従って付与されるしおりデータを含み、
    複数の電子化文書にそれぞれ対応する閲覧情報の入力を受けて、それぞれの閲覧情報を記憶する閲覧情報記憶手段と、
    前記閲覧情報記憶手段に記憶された複数の閲覧情報に含まれるしおりデータをそれぞれ対応付ける閲覧情報対応決定部と、
    前記複数の電子化文書にそれぞれ対応して、対応する文書画像を表示するための複数の文書画像表示領域を有する表示手段と、
    前記複数の電子化文書にそれぞれ対応する文書画像の入力を受けて、それぞれの文書画像を記憶する文書画像記憶手段と、
    前記複数の電子化文書のうちの特定の電子化文書の閲覧情報に含まれるしおりデータを選択指示する選択手段と、
    前記文書画像記憶手段を参照して、前記選択手段による選択指示に従って選択指示された前記閲覧情報対応決定部により対応付けられた前記複数の閲覧情報に含まれるしおりデータの対応付けに従って前記複数の電子化文書それぞれにおける文書画像内の内容領域を前記複数の文書画像表示領域にそれぞれ表示する表示制御手段とを備え
    前記閲覧情報対応決定部は、前記閲覧情報記憶手段に記憶された複数の閲覧情報に含まれるしおりデータに含まれる同一のしおりタイトルが含まれるか否かを判断し、同一のしおりタイトルが含まれる場合には、同一のしおりタイトルが含まれるしおりデータの対応付けを実行し、同一のしおりタイトルが含まれない場合には、しおりデータの順序を規定するしおりIDに基いてしおりデータの対応付けを実行する、文書処理装置。
  2. 前記閲覧情報対応決定部は、前記閲覧情報記憶手段に記憶された複数の閲覧情報に含まれるしおりデータに含まれる文書要素および位置情報あるいはこれらの組み合わせに基づいてそれぞれ対応付ける、請求項1記載の文書処理装置。
  3. 前記表示制御手段は、前記閲覧情報記憶手段に記憶された複数の閲覧情報に基いて前記複数の文書画像表示領域にそれぞれ対応して閲覧情報一覧を前記表示部に表示する、請求項1記載の文書処理装置。
  4. 前記表示制御手段は、前記閲覧情報記憶手段に記憶された複数の閲覧情報に基づいて前記複数の文書画像表示領域を総括した閲覧情報一覧を前記表示部に表示する、請求項1記載の文書処理装置。
  5. 前記表示制御手段は、前記閲覧情報対応決定部により対応づけられた前記複数の閲覧情報に含まれるしおりデータの対応付けに従って文書画像内の内容領域の一部領域を表示する、請求項1記載の文書処理装置。
JP2007241188A 2007-09-18 2007-09-18 文書処理装置 Expired - Fee Related JP5298484B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007241188A JP5298484B2 (ja) 2007-09-18 2007-09-18 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007241188A JP5298484B2 (ja) 2007-09-18 2007-09-18 文書処理装置

Publications (2)

Publication Number Publication Date
JP2009075627A JP2009075627A (ja) 2009-04-09
JP5298484B2 true JP5298484B2 (ja) 2013-09-25

Family

ID=40610570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007241188A Expired - Fee Related JP5298484B2 (ja) 2007-09-18 2007-09-18 文書処理装置

Country Status (1)

Country Link
JP (1) JP5298484B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6135331B2 (ja) * 2013-06-27 2017-05-31 カシオ計算機株式会社 電子機器、プログラム、および、検索システム、検索方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01159759A (ja) * 1987-12-16 1989-06-22 Hitachi Ltd 文書を検索・表示する方法
JP2984862B2 (ja) * 1991-05-29 1999-11-29 株式会社日立製作所 名刺電子ファイリング装置
JPH05159101A (ja) * 1991-11-01 1993-06-25 Fuji Xerox Co Ltd 文書論理構造認識および文書内容認識のための装置および方法
JPH06243172A (ja) * 1993-02-18 1994-09-02 Ricoh Co Ltd 電子ファイル装置
JPH06274543A (ja) * 1993-03-19 1994-09-30 Ricoh Co Ltd 電子ファイル装置
JP3598742B2 (ja) * 1996-11-25 2004-12-08 富士ゼロックス株式会社 文書検索装置及び文書検索方法
JP2000099522A (ja) * 1998-09-18 2000-04-07 Omron Corp 複数辞書の辞書引きシステム及びプログラム記録媒体
JP2001101202A (ja) * 1999-09-29 2001-04-13 Minolta Co Ltd 電子ブック
JP2003248690A (ja) * 2003-02-13 2003-09-05 Fuji Xerox Co Ltd 文書処理装置および方法
US20060210171A1 (en) * 2005-03-16 2006-09-21 Kabushiki Kaisha Toshiba Image processing apparatus

Also Published As

Publication number Publication date
JP2009075627A (ja) 2009-04-09

Similar Documents

Publication Publication Date Title
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
US20140192083A1 (en) Display control apparatus and display control method
JP2006120125A (ja) ドキュメント画像情報管理装置及びドキュメント画像情報管理プログラム
JP2009169538A (ja) 文書検索装置、文書検索方法及び文書検索プログラム
JP2008234148A (ja) 文書表示装置、文書表示方法及び文書表示プログラム
JP2008192055A (ja) コンテンツ検索方法、およびコンテンツ検索装置
AU2007202768A1 (en) Document processing device, program, and document processing method
US8850359B2 (en) Image processor and image processing method
JP2009075879A (ja) 画像処理装置と画像処理方法とプログラム
WO1998008168A1 (fr) Dispositif pour generer un texte original et son support de memoire programme
JP2011128945A (ja) 電子文書管理装置およびプログラム
JP2001337994A (ja) サムネイル表示システムと方法およびその処理プログラムを記録した記録媒体
JP6232736B2 (ja) 文書読解支援装置、文書読解支援システム、文書読解支援方法およびプログラム
JP5298484B2 (ja) 文書処理装置
JP2006085234A (ja) 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
US8190563B2 (en) Document management apparatus, document management method, and computer-readable encoding medium recorded with a computer program
JP2006252455A (ja) ファイル管理装置、ファイル管理方法及びファイル管理プログラム
JP2009145963A (ja) 文書処理装置および文書処理方法
JP2008158777A (ja) 画像処理装置及び方法、コンピュータプログラム及び記憶媒体
JP5310206B2 (ja) 文書処理装置、文書処理方法および文書処理プログラム
JP2005275979A (ja) 画像検索プログラム
JP2008305089A (ja) 文書処理方法、文書処理プログラム、および文書処理装置
JP2011034504A (ja) 文書処理装置、文書処理方法、プログラム及び記憶媒体
JP2008257537A (ja) 情報登録装置、情報検索装置、情報検索システム、情報登録プログラム、および情報検索プログラム
JP2009098829A (ja) 漫画のコマ検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100521

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120712

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130326

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130403

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20130415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130603

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees