以下に、図面を参照しつつ本発明の実施の形態について説明する。以下の説明においては同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同一であるもものとする。
(実施の形態1)
図1は、本発明の実施の形態に従う文書処理装置を含むシステムの概略構成図である。
本実施の形態においては、代表的に本発明に係る文書処理方法を実行するPC(Personal Computer)について説明する。
図1を参照して、PC1は、たとえば同一のオフィス内に敷設されたネットワークであるLAN(Local Area Network)に接続されているサーバ装置SRVに接続されており、また、LANとWAN(Wide Area Network)との接続点にはサーバ装置SRVが設けられている。
また、PC1とは離れた別のオフィスにあるPC2については、サーバ装置SRVを介してデータが送受信される。
ここでサーバ装置SRVは、代表的にメールサーバ、FTP(File Transfer Protocol)サーバ、WEBサーバ、SMVサーバ等で構成される。
また、本例においては、スキャナSCN1は、LANと接続され、原稿を読取ることで文書画像を取得し、そして、文書画像を含む電子化文書をPC1に出力する。また、ネットワークを介してPC2に出力するものとする。
また、同様に、スキャナSCN2は、WANと接続され、原稿を読取ることで文書画像を取得し、そして、文書画像を含む電子化文書をPC2に出力する。また、ネットワークを介してPC1に出力するものとする。
なお、本例においては、スキャナがネットワークと接続される構成について説明するが、PC1あるいはPC2と接続され、PC1あるいはPC2を介して電子化文書を送信する構成とすることも可能である。
スキャナSCN1は、原稿を読取って、読取った文書画像に含まれる文書要素の文書画像内の位置を示す情報と、当該文書要素の種別を示す情報とを含む属性情報を生成する。そして、読取った文書画像に属性情報を付加して電子化文書を生成する。代表的に電子化文書にはPDF(Portable Document Format)等のフォーマットを採用することができる。
この「文書要素」とは、文書を構成する記述要素を意味する。なお、このような属性情報は、「メタ情報(meta data)」とも称され、上述のような位置および種別を示す情報に加えて、たとえば各文書要素を代表する説明などを含めてもよい。以下の説明では属性情報の代表例として「しおり」を電子化文書に付加する構成について説明する。なお、本明細書においては、「属性情報」とは、文書要素の「文書画像内の位置」を示す情報と、当該文書要素の「種別」を示す情報とを少なくとも含むデータであり、「しおり」の他に文書要素についての補足的コメントをさらに含む「注釈」あるいは「スレッド」あるいは「アウトライン」等であってもよい。
なお、スキャナSCN2についても同様である。
スキャナSCN1により生成された電子化文書は、ネットワークを介してPC1に送信されて、PC1の記憶部に格納される。また、ネットワークを介して他のPC等に送信される。
なお、スキャナSCN1は、図示しないが原稿をセットするための載荷台と、原稿台ガラスと、載荷台に設置された原稿を原稿台ガラスに自動的に1枚ずつ搬送する搬送部と、読取られた原稿を排出するための排出台とを含む。これにより、複数枚の原稿を連続的に読取って、1つの電子化文書として生成することができる。
図2は、本発明の実施の形態に従うPCの概略構成図である。
図2を参照して、本発明の実施の形態に従うPCは、オペレーティングシステム(OS:Operating System)を含む各種プログラムを実行するCPU(Central Processing Unit)201と、代表的にDRAM(Dynamic Random Access Memory)など揮発性の記憶装置であり、CPU201でのプログラムの実行に必要なデータを一時的に記憶するメモリ部213と、CPU201で実行されるプログラムを不揮発的に記憶するハードディスク部(HDD:Hard Disk Drive)211とを含む。また、PCは、ネットワークで接続された通信インターフェイス部207と、マウスおよびキーボード等を含む入力部209と、液晶ディスプレイ等を含む表示部205とを含む。
本発明の実施の形態に従う文書処理装置は、代表的にCPU等の演算装置から構成され、HDD211等に格納されているアプリケーション等を実行することにより実現される。
このようなアプリケーションは、一般的にFDDドライブ217またはCD−ROMドライブ215を介してそれぞれフレキシブルディスク217aあるいはCD−ROM(Compact Disk-Read Only Memory)215aから読取られてHDD211に格納される。もしくはネットワーク配信されるアプリケーションを通信インターフェイス部207を介して受信しHDD211に格納することも可能である。
CPU201は、キーボードやマウス等からなる入力部209を介して利用者からの指示を受けるとともにプログラムの実行において生成される画面表示を表示部205へ出力する。具体的には、CPU201は、表示部205に本発明に係る文書処理装置における文書閲覧画面を表示する。
また、CPU201は、LANカード等からなる通信インターフェイス部207を介してLANやWANに接続されたスキャナSCN1,SCN2(以下、総称してスキャナSCNとも称する)あるいはサーバ装置SRVあるいは他のPC(たとえばPC2等)から電子化文書を取得してメモリ部213に格納する。また、上述の各部は内部バス203を介して相互にデータを授受する。
通信インターフェイス部207は、代表的にはネットワーク(たとえばLAN)を介してPC等との間でデータを送受信するための部位であり、たとえばLANアダプタおよびそれを制御するドライバソフト等を含む。
図3は、本発明の実施の形態に従う文書処理方法を実現するためのスキャナSCNおよびPCのブロック構成図である。
まず、スキャナSCNの構成について説明する。
スキャナSCNは、画像読取部3と、デジタル画像生成部4と、画像データ記憶部5と、文書要素抽出部2と、圧縮処理部6と、電子化文書生成部7と、しおりデータ生成部8と、送信部1とを含む。
画像読取部3は、紙原稿を読取って文書画像を取得し、その文書画像をデジタル画像生成部4に出力する。デジタル画像生成部4は、主としてパーソナルコンピュータPC等での表示に適するように文書画像の表示特性を調整する。また、文書画像に含まれるノイズを除去することも可能である。
そしてデジタル画像生成部4で処理された文書画像のデータは画像データ記憶部5に送られる。
画像データ記憶部5は、取得された文書画像のデータを一時的に格納する部位であり、一旦格納した文書画像を圧縮処理部6および文書要素抽出部2に出力する。
圧縮処理部6は、画像データ記憶部5から出力される文書画像を圧縮処理して電子化文書生成部7へ出力する。この圧縮処理による圧縮度合は、生成される電子化文書の大きさや要求される文書画像の解像度などに応じて変化させてもよく、また圧縮処理はJPEG(Joint Photographic Experts Group)などの非可逆変換であってもよい。
なお、高解像度が要求されるような場合には圧縮処理を省略することもできる。
文書要素抽出部2は、画像データ記憶部5から出力される文書画像に含まれる所定の種別の文書要素を抽出する。文書要素抽出部2は、この文書要素の抽出に際して、各文書要素の文書画像内における位置も抽出する。そして文書要素抽出部2は、抽出した文書要素の種別およびその位置情報をしおりデータ生成部8に出力する。
文書画像に含まれる文書要素の抽出処理について説明すると、文書要素の抽出については公知の方法を用いることができるが、代表的に文字サイズや隣接する領域に対する間隔などに基づいて、各領域が抽出される。たとえば具体的には、「表題(タイトル)」は、文書画像内に配置される文字の文字サイズに基づいて抽出することができる。「見出し」は、文書画像内におけるオフセット位置やインデント位置などに基づいて抽出することができる。
なお、文書要素として抽出する種別は、上述のものに限られることはなく公知の認識技術を用いてさまざまな種別の文書要素を抽出することも可能である。
しおりデータ生成部8は、文書要素抽出部2から出力される文書要素の文書画像内の位置情報と種別とに基づいて属性情報である後述するしおりデータを生成する。そしてしおりデータ生成部8は、生成したしおりデータを電子化文書生成部7へ出力する。
電子化文書生成部7は、圧縮処理部6からの(圧縮された)文書画像にしおりデータ生成部8からのしおりデータを付加することで電子化文書を生成する。
出力部1は、しおりデータと画像データから閲覧に適したファイル形式に変換し、変換したファイルデータを各種の通信プロトコルに従って本例においてはPC201に出力する。次にPC201の構成について説明する。
PC201は、入力部に含まれるマウス等のポインティングデバイスの操作指示に従ってI/O部18からの入力データの入力を受け付けて、入力された操作指示内容を検知するマウス指定座標検知部14と、スキャナSCNからの電子化文書の入力を受けてPDFファイルデータから画像データおよびしおりデータを分離した後にメモリ部213の記憶部にそれぞれ出力する文書入力部9と、メモリ部213に入力されたしおりデータをそれぞれ対応付ける閲覧情報対応決定部15と、マウスの操作入力に従って指示された内容に基づいてメモリ部213に格納された画像データを参照して、しおりデータに対応する画像データを表示部205に出力する表示制御部19とを含む。また、表示制御部19は、必要に応じてしおりデータに基づいてしおり一覧を生成して表示部205に表示する。
図4は、電子化文書生成部7が生成する電子化文書のデータ構造の一例を示す図である。
図4(a)を参照して、電子化文書400は、ヘッダ部402と、本体部404と、しおりデータ部405と、フッタ部406とから構成される。
ヘッダ部402およびフッタ部406には電子化文書の属性についての情報、たとえば作成日時・作成者・著作権情報等が格納される。
本体部404は、各ページに対応する文書画像が格納される。また、しおりデータ部405には、属性情報である文書画像に含まれる文書要素を特定するための生成されたしおりデータが格納される。
図4(b)に示されるように、複数のページデータとしおりデータがあり、ページツリーとしおり階層を介してドキュメントカテゴリの下に配置される構成を取る。具体的には、ページツリーにページ間の順序が記述される。なお、本例におけるしおりデータは、後述するがしおりIDと、しおりタイトル、対象に関する記述としおりデータ間の関係に関する記述を含む。
図5は、本発明の実施の形態1に従う文書処理装置で処理される第1および第2の文書画像の具体例を説明する図である。
図5(a)を参照して、ここでは第1の文書画像が示されている。第1の文書画像は、3ページの文書画像で構成されている。そして、第1の文書画像において、文書要素500〜505が特定された場合が示されている。具体的には、「報告書A」の文書要素500、「第1章」の文書要素501、「第2章」の文書要素502、「第3章」の文書要素503、「第4章」の文書要素504、「第5章」の文書要素505が示されている。
図5(b)を参照して、ここでは第2の文書画像が示されている。第2の文書画像は、4ページの文書画像で構成されている。そして、第2の文書画像において、文書要素510〜515が特定された場合が示されている。具体的には、「報告書A」の文書要素510、「第1章」の文書要素511、「第2章」の文書要素512、「第3章」の文書要素513、「第4章」の文書要素514、「第5章」の文書要素515が示されている。
図6は、本発明の実施の形態1に従うしおりデータのデータ構造の一例を説明する図である。
図6(a)には、第1の文書画像において、特定された文書要素500〜505に基づいて第1の文書画像のしおりデータの一覧が示されている。
また、図6(b)には、第2の文書画像において、特定された文書要素510〜515に基づいて第2の文書画像のしおりデータの一覧が示されている。
具体的には、各文書要素に対応付けて、しおりデータの出現順序を規定する「しおりID」、対応する文書要素の種別(名称)を特定する「しおりタイトル」、そして、対応するしおりデータの前後のしおりデータのID情報(「前後のしおり」)、そして、識別されたページ(「ページ識別」)と「座標」とが格納される。なお、ここでは、文書要素の種別として「title」、「1.0」・・・等が示されており、「title」は、表題を意味する。また、「1.0」・・・等は、見出しを意味するものとする。
「ページ識別」は、対応する文書要素が存在する文書画像におけるページを特定するための位置情報である。また、「座標」(left, bottom, right, top)は、対応する文書要素のページ内での領域(矩形)を特定するための位置情報である。
具体的には、第1の文書画像において、「報告書A」の文書要素500は、「しおりID」が「1」、「しおりタイトル」が「title」、「前後のしおり」が「_,2」、「ページ識別」が「1」、「座標」が「X11,Y11,X12,Y12」として記述されている。なお、「前後のしおり」の「_」の記号はnull記号であり前後に何もIDが無いことを指し示すものである。「第1章」の文書要素501は、「しおりID」が「2」、「しおりタイトル」が「1.0」、「前後のしおり」が「1,3」、「ページ識別」が「1」、「座標」が「X21,Y21,X22,Y22」として記述されている。以下、同様にして、しおりデータが記述されている。第2の文書画像についても同様である。
図7は、本発明の実施の形態1に従う文書処理装置の文書処理方法を説明する図である。
なお、本例においては、一例として、上記で説明した第1および第2の文書画像を例に挙げた文書処理方法について説明する。
図7を参照して、まずマウス操作があるかどうかを判断する(ステップS1)。具体的には、表示制御部19は、マウス指定座標検知部14を介する図3で説明したマウス3の操作に基づくI/O部18からの操作に従う入力データが有るかどうかを判断する。無ければ、ステップS1を維持する。
次に、マウス3が後述するしおり一覧の上にあるか否かを判断する(ステップS2)。
具体的には、表示制御部19は、マウス指定座標検知部14を介するI/O部18からの操作に従う入力データに従ってマウスの指定座標がしおり一覧上の領域内であるか否かを判断する。無ければ、ステップS1に戻る。なお、しおり一覧は、表示制御部19により上述したしおりデータの一覧に基づいて生成され、しおり一覧に示されるしおりは、しおりIDと対応付けられているものとする。
次に、表示制御部19は、マウス指定座標検知部14を介してマウス3をクリックしたかどうかを判断する(ステップS3)。具体的には、マウス3の指定座標がしおり一覧上にあって、マウス3によりしおりをクリックした場合には、次のステップに進み、第1の画像データ記憶部10からクリックされたしおりを含む表示データを生成する(ステップS4)。一方、クリックされない場合には、最初のステップS1に戻る。
そして、次にクリックされたしおりに対応する第2の文書画像のしおりを判定する(ステップS5)。具体的には、表示制御部19は、閲覧情報対応決定部15に対してしおりデータの対応付けを実行するように指示する。そして、閲覧情報対応決定部15において、しおりデータの対応付けが実行されてその結果が表示制御部19に出力される。
クリックされたしおりに対応する第2の文書画像のしおりを判定する方式すなわちしおりデータの対応付けを実行する方式については後述する。
そして、次に対応するしおりを含む第2の画像データ記憶部13から表示データを生成する(ステップS6)。
そして、文書閲覧画面における第1の文書画像の表示を更新する(ステップS7)。
次に、文書閲覧画面における第2の文書画像の表示を更新する(ステップS8)。そして終了する。
次に、本発明の実施の形態1に従う第1のしおりデータと、第2のしおりデータとの対応付けについて説明する。なお、第1のしおりデータと第2のしおりデータとの対応付けは、表示制御部19からの指示に従って閲覧情報対応決定部15で実行されるものとする。
図8は、本発明の実施の形態1に従う第2の画像データのしおりを判定するフロー図である。
図8を参照して、まずクリックされた第1の文書画像のしおりIDを取得する(ステップS10)。具体的には、しおり一覧上にあって、しおりは、上述したように対応するしおりIDと対応付けられており、しおりをクリックした場合には、閲覧情報対応決定部15は、表示制御部19から対応するしおりIDを取得する。
そして、次に閲覧情報対応決定部15は、第1のしおりデータ記憶部11を参照して、対応するしおりIDのデータを取得する(ステップS11)。具体的には、第1のしおりデータ記憶部11から取得されたしおりIDに基づくデータを取得する。例えば、しおり一覧において、「title」をマウスでクリックした場合には、「title」に対応するしおりID「1」が取得され、しおりID「1」に対応するデータを取得する。
そして、次に閲覧情報対応決定部15は、第2のしおりデータ記憶部12を参照して、クリックしたしおりタイトルと同一のしおりタイトルを持つしおりを検索する(ステップS12)。
例えば、第1の画像データの「title」をマウスでクリックした場合には、第2のしおりデータを参照して、「title」のしおりが検索される。
そして、次に同一のしおりタイトルを持つしおりがあるかどうかを判断する(ステップS13)。
同一のしおりタイトルを持つしおりがある場合には、次にその数が1つかどうかを判断する(ステップS19)。
同一のしおりタイトルを持つしおりが1つである場合には、検索されたしおりIDを出力する(ステップS20)。
例えば、第1の画像データの「title」をマウスでクリックした場合には、第2のしおりデータを参照して、「title」のしおりを検索して、閲覧情報対応決定部15は、表示制御部19にステップS13およびステップS19を介して、検索されたしおりのしおりIDである「1」を出力する。
一方、ステップS19において同一のしおりタイトルを持つしおりが複数ある場合にはステップS21に進み、第1のしおりデータ記憶部11を参照して、クリックしたしおりタイトルと同一のしおりを検索する(ステップS21)。
例えば、第2のしおりデータにクリックしたしおりタイトルと同一の複数のしおりタイトルが含まれているような場合には、しおりの出現順に従って対応するしおりIDを特定する。
まず、ステップS21で検索した結果、第1のしおりデータを参照して、クリックしたしおりタイトルが複数存在するか否か、すなわちその数が1つかどうかを判断する(ステップS22)。
ステップS22において、その数が1つである場合には、第2のしおりデータを参照して、ページ識別と座標から検索されたしおりIDの出現順を特定する(ステップS23)。
そして、次に先に現れるしおりのしおりIDを出力する(ステップS24)。
例えば、第1のしおりデータには、クリックしたタイトルと同一のしおりタイトルが1つであり、第2のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数含まれるような場合に相当する。当該場合には、第2のしおりデータを参照して、同一のしおりタイトルのしおりIDの出現順を特定して、第1のしおりデータのクリックしたタイトルのしおりIDと第2のしおりデータの先に現れるしおりIDとの対応付けを実行するものである。
ステップS22においてその数が1つではない場合すなわち複数ある場合には、第1のしおりデータを参照してページ識別と座標からしおりIDの出現順を特定する(ステップS25)。
そして、次に第2のしおりデータを参照してページ識別と座標からしおりIDと出現順が同じしおりIDを特定する(ステップS26)。
そして出現順が同じあるいは近いしおりのしおりIDを出力する(ステップS27)。
例えば、第1のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数(2つ)あり、第2のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数(2つ)含まれるような場合に相当する。当該場合には、第1のしおりデータを参照して、同一のしおりタイトルのしおりIDの出現順を特定する。そして、第2のしおりデータを参照して、同一のしおりタイトルのしおりIDの出現順を特定する。
そして、出現順が同じしおりIDを出力することになる。
なお、第1のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数あり、第2のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数含まれるような場合にそれぞれ同数あるいは第2のしおりデータの個数が多い場合には、出現順に従って付けることが可能であるが、第1のしおりデータの個数が多い場合には、出現順が同じしおりIDを常に対応付けることができない。
例えば、第1のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数(3つ)あり、第2のしおりデータには、クリックしたタイトルと同一のしおりタイトルが複数(2つ)含まれるような場合に相当する。当該場合には、第1のしおりデータの最初の2つのしおりタイトルについて出現順に従って第2のしおりデータと対応付けることが可能であるが、最後のしおりタイトルについては、出現順に従って対応付ける第2のしおりデータのしおりタイトルが無いため、係る場合には、第2のしおりデータの最後のしおりタイトルと対応付けることととする。すなわち、出現順が近いしおりIDと対応付けられて出力されるものとする。
ステップS13において、同一のしおりタイトルを持つしおりがない場合には、第1のしおりデータを参照して、しおりIDの前後のしおりIDを出力する(ステップS14)。
例えば、第2のしおりデータにクリックしたしおりタイトルと同一のしおりタイトルが含まれていないような場合には、クリックしたしおりタイトルに対応するしおりIDの前後のしおりIDの情報に基づいて、第2のしおりデータにおける対応するしおりIDを特定する。
そして、前のしおりIDのデータを取得してしおりIDと置き換える(ステップS15)。
例えば、第1の画像データのしおりタイトル「2.0」をマウスでクリックした場合に、第2のしおりデータを参照して、同一のしおりタイトルを検索して、同一のしおりタイトルが無いと仮定すると、しおりデータの「前後のしおり」からしおりID「1,3」を取得する。前のしおりID「1」と置き換える。
次に、同一のしおりタイトルを持つしおりがあるかどうかを判断する(ステップS16)。
すなわち、第2のしおりデータにおいて、置き換えたしおりIDに対応するしおりタイトルと同一のしおりタイトルを持つしおりがあるかどうかを判断する。
そして、ステップS16において、同一のしおりタイトルを持つしおりがある場合にはステップS19に進み、その後の処理については上述したのと同様であるのでその詳細な説明は繰り返さない。すなわち、この場合には、クリックしたしおりタイトルと同一のしおりタイトルを第2のしおりデータが有していない場合には、前のしおりIDのしおりタイトルと同一のしおりタイトルを第2のしおりデータが有しているか検索して、しおりIDを特定するものである。
一方、ステップS16において同一のしおりタイトルを持つしおりがない場合には、後のしおりIDのデータを取得してしおりIDと置き換える(ステップS17)。
例えば、第1の画像データのしおりタイトル「2.0」をマウスでクリックした場合に、第2のしおりデータを参照して、同一のしおりタイトルを検索して、同一のしおりタイトルが無いと仮定すると、しおりデータの「前後のしおり」からしおりID「1,3」を取得する。そして、ステップS16において、前のしおりID「1」と同一のしおりタイトルが無い場合には、後のしおりID「3」と置き換える。
次に、同一のしおりタイトルを持つしおりがあるかどうかを判断する(ステップS18)。
すなわち、第2のしおりデータにおいて、置き換えたしおりIDに対応するしおりタイトルと同一のしおりタイトルを持つしおりがあるかどうかを判断する。
そして、ステップS18において、同一のしおりタイトルを持つしおりがある場合にはステップS19に進み、その後の処理については上述したのと同様であるのでその詳細な説明は繰り返さない。すなわち、この場合には、クリックしたしおりタイトルと同一のしおりタイトルを第2のしおりデータが有していない場合には、後のしおりIDのしおりタイトルと同一のしおりタイトルを第2のしおりデータが有しているか検索して、しおりIDを特定するものである。
一方、ステップS18において、同一のしおりタイトルを持つしおりがない場合には、しおりID(置換前)のページ識別と座標を取得する(ステップS28)。
しおりIDの前後のしおりIDに対応するしおりタイトルと同一のしおりタイトルがない場合には、クリックしたしおりタイトルに対応するページ識別と座標の情報に基づいて、第2のしおりデータにおける対応するしおりIDを特定する。
まず、第2のしおりデータ記憶部を参照して、同じページ識別を持つしおりを検索する(ステップS29)。
そして、同じページ識別のしおりがあるかどうかを判断する(ステップS30)。
第2のしおりデータを参照して、同じページ識別を持つしおりがある場合にはその数が1つかどうかを判断する(ステップS31)。
その数が1つである場合には検索されたしおりのしおりIDを出力する(ステップS32)。
しおりIDの前後のしおりIDに対応するしおりタイトルと同一のしおりタイトルがない場合には、クリックしたしおりタイトルのしおりデータのページ識別と同じページ識別を持つしおりIDと対応付けることとする。
一方、ステップS31において、その数が複数ある場合には座標が最も近いしおりを算出する(ステップS33)。
算出されたしおりのしおりIDを出力する(ステップS34)。
具体的には、クリックしたしおりタイトルに対応するページ識別と座標の情報に基づいて、座標間の距離を算出することにより、第2のしおりデータにおける最も近いしおりを算出して、算出されたしおりIDと対応付けることとする。
一方、ステップS30において、同じページ識別のしおりがない場合には、第2のしおりデータ記憶部を参照して、最後尾のしおりを検索する(ステップS35)。
そして、検索されたしおりのしおりIDを出力する(ステップS36)。
すなわち、第2のしおりデータにおいて、同じページ識別のしおりが無い場合には、第2のしおりデータのページが第1のしおりデータに比べて少ない可能性が高いため当該場合には、最後尾のしおりが最も近いしおりであると考えられるため最後尾のしおりのしおりIDと対応付けることとする。
図9は、図5および図6で説明した第1および第2の文書画像において、しおり一覧をマウスにより指定した場合の画面表示の例について説明する図である。
図9(a)においては、表示部205に表示された文書閲覧画面において、報告書FAのタイトルが付された第1の文書画像の表示領域600と、報告書FA#のタイトルが付された第2の文書画像の表示領域610とが設けられている場合が示されている。
そして、表示領域600には、第1の文書画像のしおりデータのしおり一覧602と、画像データ表示領域604とが示されている。また、表示領域610には、第2の文書画像のしおりデータのしおり一覧612と、画像データ表示領域614とが示されている。
そして、しおり一覧602の「4.0」をマウスにより指定した場合の画面が表示されている。
第1の文書画像のしおり一覧602の「4.0」をマウスにより指定した場合においては、図7のステップS4において、表示制御部19は、第1の画像データ記憶部10からクリックされた「4.0」のしおりを含む表示データを生成する。具体的には、第1の画像データ記憶部10を参照して、クリックしたしおりが含まれるページ識別「2」の画像データを生成する。
そして、次に、ステップS5において、クリックされたしおりに対応する第2の画像データのしおりを判定する。
この場合、しおり一覧602の「4.0」をマウスにより指定した場合、表示制御部19は、しおりID「5」を取得する。そして、閲覧情報対応決定部15に対してしおりID「5」を出力する。閲覧情報対応決定部15は、クリックされたしおりに対応する第2の文書画像のしおりを判定する。
具体的には、図8のフローに従って、第2のしおりデータ記憶部12を参照して、クリックしたしおりタイトルと同一のしおりタイトルを持つしおりを検索し、検索されたしおりタイトル「4.0」に対応するしおりID「5」を出力する。
そして、ステップS6において、第2の画像データ記憶部13から対応するしおりであるしおりタイトル「第4章」を含む表示データを生成する。
そして、ステップS7,S8において、文書閲覧画面における第1および第2の画像データの表示が更新される。
なお、図9(a)においては、表示制御部19は、しおりタイトル「4.0」について強調表示するとともに、「第4章」の部分が矩形領域で囲むことにより強調表示している場合が示されている。なお、当該矩形領域部分の表示色を他の領域の色と変更して赤色等の判別し易い色で表示することも可能である。
図9(b)においては、第1の文書画像のしおり一覧602の「2.0」をマウスにより指定した場合の画面が表示されている。
第1の文書画像のしおり一覧602の「2.0」をマウスにより指定した場合においては、図7のステップS4において、表示制御部19は、第1の画像データ記憶部10からクリックされた「2.0」のしおりを含む表示データを生成する。具体的には、第1の画像データ記憶部10を参照して、クリックしたしおりが含まれるページ識別「1」の画像データを生成する。
そして、次に、図7のステップS5において、クリックされたしおりに対応する第2の文書画像のしおりが判定される。
この場合、しおり一覧602の「2.0」をマウスにより指定した場合、しおりID「3」が取得される。
そして、第2のしおりデータ記憶部12を参照して、クリックしたしおりタイトルと同一のしおりタイトルを持つしおりを検索し、検索されたしおりタイトル「2.0」に対応するしおりID「3」を出力する。
そして、図7のステップS6において第2の画像データ記憶部13から対応するしおりであるしおりタイトル「第2章」を含む表示データを生成する。
そして、ステップS7,S8において、第1および第2の画像データの表示が更新される。
図9(c)においては、第1の文書画像のしおり一覧602の「title」をマウスにより指定した場合の画面が表示されている。
第1の文書画像のしおり一覧602の「title」をマウスにより指定した場合においては、図7のステップS4において、表示制御部19は、第1の画像データ記憶部10からクリックされた「title」のしおりを含む表示データを生成する。具体的には、第1の画像データ記憶部10を参照して、クリックしたしおりが含まれるページ識別「1」の画像データを生成する。
そして、次に、図7のステップS5において、クリックされたしおりに対応する第2の文書画像のしおりが判定される。
この場合、しおり一覧602の「title」をマウスにより指定した場合、図8を参照して、しおりID「1」が取得される。
そして、第2のしおりデータ記憶部12を参照して、クリックしたしおりタイトルと同一のしおりタイトルを持つしおりを検索し、検索されたしおりタイトル「title」に対応するしおりID「1」を出力する。
そして、図7のステップS6において第2の画像データ記憶部13から対応するしおりであるしおりタイトル「報告書A」を含む表示データを生成する。
そして、ステップS7,S8において、第1および第2の画像データの表示が更新される。
当該方式により、マウス操作により、文書閲覧画面における第1の文書画像のしおりをクリックすることにより、閲覧情報対応決定部15において第1の文書画像のしおりデータと第2の文書画像のしおりデータとの対応付けが実行されて、第2の文書画像の対応するしおりが含まれる箇所を自動的に表示して参照することができるので、少ない操作で適格に該当箇所の比較を実行することが可能である。
また、本例においては、文書閲覧画面における第1の文書画像のしおりをクリックすることにより、第2の文書画像の対応するしおりが含まれる箇所が表示される方式について説明したが、反対に文書閲覧画面における第2の文書画像のしおりをクリックすることにより第1の文書画像の対応するしおりが含まれる箇所を表示させることも当然に可能である。
なお、指定するマウスの座標に従って対応付けの関係を切り替えることも可能である。例えば、第1の文書画像のしおり一覧をクリックした場合には、クリックした第1の文書画像のしおりに対応するしおりが含まれる第2の文書画像を表示し、第2の文書画像のしおり一覧をクリックした場合には、クリックした第2の文書画像のしおりに対応するしおりが含まれる第1の文書画像を表示させるようにすることも可能である。
また、本例においては、第1および第2の文書画像を表示する場合について説明しているが、特に2つに限られず、さらに複数の文書画像を表示させるようにすることも可能である。具体的には、メモリ部213に複数の文書画像にそれぞれ対応して画像データ記憶部およびしおりデータ記憶部を設けて閲覧情報対応決定部15においてしおり判定を実行することにより実現可能である。なお、この場合、マウスによりしおり一覧をクリックした対応する文書画像が第1の文書画像に相当し、それ以外の複数の文書画像の各々が第2の文書画像に相当する。
(実施の形態1の変形例1)
また、本発明の実施の形態1においては、単一の文書画像のしおり一覧をそれぞれ作成して表示する構成であったが、同時に表示する複数の文書画像のしおり一覧を統合して1つのしおり一覧を作成することも可能である。
図10は、本発明の実施の形態1の変形例に従う画面を説明する図である。
図10を参照して、本例においては、表示部205に表示された文書閲覧画面において、報告書FAのタイトルが付された第1の文書画像の表示領域700と、報告書FA#のタイトルが付された第2の文書画像の表示領域710とが設けられている場合が示されている。
そして、表示領域700には、第1の文書画像の画像データ表示領域702が示されている。また、表示領域710には、第2の文書画像の画像データ表示領域712が示されている。
そして、第1の文書画像および第2の文書画像のしおりデータについて一括してしおり一覧714が設けられている場合が示されている。
なお、この場合同じしおりタイトルが複数現れることが考えられるが、このような重複したしおりタイトルを除いて表示することも可能であるし、文書画像の識別子等を付加することで区別することも可能である。
(実施の形態1の変形例2)
また、上記の実施の形態1においては1ページ相当を画面にそれぞれ表示する構成としていたが、たとえば第1の文書画像以外は対応するしおり部分のみを表示する構成とすることも可能である。
図11は、本発明の実施の形態1の変形例2に従う画面表示を説明する図である。
図11を参照して、本例においては、表示部205に表示された文書閲覧画面において、報告書FAのタイトルが付された第1の文書画像の表示領域800が示されている。
そして、表示領域800には、第1の文書画像のしおりデータのしおり一覧802と、画像データ表示領域804とが示されている。また、報告書FA#のタイトルが付された第2の文書画像の表示領域810と、報告書FBのタイトルが付された第3の文書画像の表示領域822と、報告書FCのタイトルが付された第4の文書画像の表示領域824とが示されている。
そして、ここでは第1の文書画像のしおり一覧802において「4.0」がマウスにより指定された場合に、第2および第3および第4の文書画像において、対応するしおり部分のみが拡大されて表示されている場合がそれぞれ示されている。
具体的には、第1の文書画像が表示される画面802において、しおり「4.0」に対応する画面表示がなされるとともに、第2〜第4の文書画像が表示される画面810,822,824において、対応するしおり部分である「第4章」、「4.新体制」、「第4新体制」という標記で一例としてそれぞれ示されている。
当該方式により、複数の文書画像のしおり部分のタイトルの比較を簡易に実行することが可能である。
(実施の形態2)
また上記の実施の形態1においては、選択された第1の文書画像のしおりと、第2の文書画像の既存のしおりとを対応付ける方式について説明したが、第2の文書画像に対して表示用の新規のしおりを新たに生成するようにすることも可能である。
たとえば、図8のステップS13において、同一のしおりタイトルを持つしおりが無いと判定された場合には、対応するしおりタイトルの前後のしおりIDに対応する第2のしおりデータと同じしおりがあるか否かを判定して、存在する場合には、それらのしおりの位置の中間に表示用の新規のしおりデータを生成して、しおりIDと対応付けることも可能である。
図12は、本発明の実施の形態2に従う第2の画像データのしおりを判定するフロー図である。
図12を参照して、図8と比較して、ステップS40〜ステップS42をさらに追加した点が異なる。その他の点については同様であるのでその詳細な説明は繰り返さない。
ステップS40において、第2のしおりデータを参照して、取得した前後のしおりIDに対応するしおりタイトルと同一のしおりタイトルがあるか判定する。
ステップS40において、同一のしおりタイトルがある場合には、しおりを作成する(ステップS41)。具体的には、前後のしおりIDに対応するしおりタイトルと同一のしおりタイトルの間の中間に新規のしおりを作成する。
そして、生成したしおりのしおりIDを出力する(ステップS42)。
一方、ステップS40において、同一のしおりタイトルが無い場合には、ステップS15に進む。以降の処理については同様であるのでその詳細な説明は繰り返さない。
すなわち、同一のしおりタイトルを持つしおりが無いと判定された場合に、対応するしおりタイトルの前後のしおりIDに対応する第2のしおりデータと同じしおりがある場合には、その中間に新規のしおりを生成して、当該しおりと対応付けることとする。
図13は、本発明の実施の形態3に従う新規のしおりの生成について説明する図である。
図13を参照して、本例においては、第1の文書画像においてしおりIDがB1〜B3のしおりデータが存在する場合に、第2の文書画像のしおりIDと対応付ける場合の例について説明する。ここで、始め第2の文書画像のしおりIDは、C1,C2のしおりデータのみとする。
第1の文書画像において、しおりIDがB2である「第1.1章」がマウスにより指定された場合、第2の文書画像には、「第1.1章」と同じしおりタイトルは無いため図12のステップS13において、「NO」となる。そして、ステップS14において、第1のしおりデータ記憶部を参照して、しおりIDの前後のしおりIDを取得する。本例においては、しおりIDとしてB1,B3が取得される。
そして、次に、ステップS40において、第2のしおりデータ記憶部を参照して、取得した前後のしおりIDに対応するしおりタイトルと同一のしおりタイトルがあるかどうかを判定する。
そして、本例においては、第2の文書画像において、しおりIDとしてB1,B3に対応するしおりタイトルと同一のしおりタイトルがあるためステップS41に進み、新たなしおりを作成する。
具体的には、第2の文書画像のしおりIDのC1とC2のしおりデータから中間の位置にしおりIDがDであるしおりを生成する。
これにより、第1の文書画像のしおりIDがB2である「第1.1章」について、第2の文書画像において、新たに中間に設けられたしおりIDがDであるしおりと対応付けられるため、実施の形態1の場合には対応付けが的確にできないような場合であっても、対応付けられる可能性の高い箇所の比較を簡易に行なうことができる。
(実施の形態3)
また上記の実施の形態においては、マウスからのクリック操作が行なわれたタイミングで選択された第1の文書画像の1つのしおりと、第2の文書画像におけるしおりデータの1つとを対応付ける方式であったが、第1の文書画像のしおりが選択可能であれば他の方法を用いることも可能である。
図14は、本発明の実施の形態3に従う画面表示を説明する図である。
本発明の実施の形態3に従う方式においては、スクロールバー920を用いて第1の文書画像の1つのしおりと、第2の文書画像におけるしおりデータの1つとを対応付ける方式について説明する。
図14を参照して、本例においては、表示部205に表示された文書閲覧画面において、報告書FAのタイトルが付された第1の文書画像の表示領域900が示されている。
そして、表示領域900には、画像データ表示領域902と、スクロールバー920とが示されている。また、報告書FA#のタイトルが付された第2の文書画像の表示領域910が示されている。
たとえばスクロールバー920はマウスやキーボード等を用いて操作可能であり、第1の文書画像の表示領域を移動させることができる。そして、本例においては、表示領域内の最上位のしおりが選択されたしおりであるものとして、第2の画像のしおりデータと対応付けることとする。
具体的には、マウス指定座標検知部14は、スクロールバー920のバーの位置を検知して表示制御部19に出力する。表示制御部19は、スクロールバー920のバーの位置に従って第1の画像データ記憶部10の画像データを参照して表示領域に表示するとともに、当該表示領域に表示されている画像データに含まれている最上位のしおりが指定されたしおり(すなわちクリックされたしおり)であると判断する。そして、指定されたしおりに対応する第2の画像データのしおりを判定し、第2の画像データ記憶部から対応するしおりを含む表示データを生成する。以降の処理については図7で説明した方式と同様であるのでその詳細な説明は繰り返さない。
本発明の実施の形態3に従う方式においては、しおり一覧をマウスを用いて指定するのではなく、スクロールバー920を用いて表示領域内の最上位のしおりが指定されたものとして判断することにより、第1の文書画像の表示領域の移動に伴って、第2の文書画像の表示領域の移動も連続的に実行されるためスムーズな比較判断を実行することが可能である。
また、上記の実施の形態においては、マウスからのクリック操作等が行なわれたタイミングで、選択された1つのしおりに対する第2のしおりデータの1つを対応付けるものであったが、電子化文書が入力された時点で第1のしおりデータと第2のしおりデータとを対応付けて、その結果をメモリ部に記憶させることも可能である。
当該場合には、メモリ部に記憶された対応付けられたしおりデータを用いて表示制御部19が表示制御を実行することができるため、マウス操作が行なわれたタイミングで予め定められたメモリ部に記憶されている結果を参照することにより、マウス操作に対する画面の更新を高速化させることが可能である。
なお、上記した文書処理装置は、例えば、あるオフィスの利用者と、別のオフィスにある利用者とが各々別々に作成した文書を比較しながら会議を行なうような遠隔会議システムと組み合わせて使用することも可能である。
なお、コンピュータを機能させて、上述のフローで説明したような制御を実行させるプログラムを提供することもできる。このようなプログラムは、コンピュータに付属するフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)およびメモリカードなどのコンピュータ読取り可能な記録媒体にて記録させて、プログラム製品として提供することもできる。あるいは、コンピュータに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
なお、本発明にかかるプログラムは、コンピュータのオペレーションシステム(OS)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかるプログラムに含まれ得る。
また、本発明にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストール
されて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記録された記録媒体とを含む。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
1 送信部、2 文書要素抽出部、3 画像読取部、4 デジタル画像生成部、5 画像データ記憶部、6 圧縮処理部、7 電子化文書生成部、8 しおりデータ生成部、9 文書入力部、10 第1の画像データ記憶部、11 第1のしおりデータ記憶部、12 第2のしおりデータ記憶部、13 第2の画像データ記憶部、14 マウス指定座標検知部、15 閲覧情報対応決定部、17 マウス、18 I/O部、19 表示制御部、201 CPU、203 内部バス、205 表示部、207 通信インターフェイス部、209 入力部、211 HDD、213 メモリ部、215 CD−ROMドライブ、217 FDDドライブ。