JP2007281673A - 情報処理装置および情報処理プログラム - Google Patents

情報処理装置および情報処理プログラム Download PDF

Info

Publication number
JP2007281673A
JP2007281673A JP2006103028A JP2006103028A JP2007281673A JP 2007281673 A JP2007281673 A JP 2007281673A JP 2006103028 A JP2006103028 A JP 2006103028A JP 2006103028 A JP2006103028 A JP 2006103028A JP 2007281673 A JP2007281673 A JP 2007281673A
Authority
JP
Japan
Prior art keywords
information
content
document data
document
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006103028A
Other languages
English (en)
Inventor
Hiroyuki Soda
宏之 左右田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006103028A priority Critical patent/JP2007281673A/ja
Priority to US11/636,577 priority patent/US20070233661A1/en
Priority to CNA2007100019648A priority patent/CN101051312A/zh
Publication of JP2007281673A publication Critical patent/JP2007281673A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9554Retrieval from the web using information identifiers, e.g. uniform resource locators [URL] by using bar codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Image Processing (AREA)

Abstract

【課題】ハイパー文書にリンク情報を埋め込んで印刷出力する場合に、リンク先コンテンツが印刷時の内容と同一か否かをチェックし得るようにする。
【解決手段】文書データに関連するコンテンツを特定するための情報を当該文書データ中に埋め込んで印刷出力可能にする画像生成手段14と、前記コンテンツについての特徴量情報を取得する特徴量取得手段16と、前記文書データ中への情報埋め込み時点における前記コンテンツについての特徴量情報を当該文書データ中への埋め込み情報と対応付けて管理する情報管理手段17とを備えて、情報処理装置を構成する。
【選択図】図2

Description

本発明は、関連するコンテンツについてのリンク情報を有する文書データを印刷出力する場合に用いて好適な情報処理装置および情報処理プログラムに関する。
近年、コンピュータ上で取り扱われる電子文書として、いわゆるハイパー文書が広く利用されている。ハイパー文書とは、テキスト、イメージ、グラフィックス等の文書を構成する画像要素に、これと関連する文書、画像要素、音声、映像等の情報(以下「コンテンツ」という)を結びつけるためのリンクを有したものである。例えば、印刷に適した文書フォーマットとして有名なPDF(Portable Document Format)もハイパーリンクを含むことができ、モニタで閲覧する際にはマウスと呼ばれる指示器でその文書を構成する画像要素を指し示すことで、その画像要素に関連するコンテンツを即座に閲覧あるいは再生することができる。
このようなハイパー文書は、単に印刷出力を行ったのみのでは、そのハイパー文書が有する情報のうち視認可能な情報しか記録されず、リンクについての情報等は直接紙上に出力されないので、その特長(性質)が失われてしまう。このことから、従来、ハイパー文書の印刷出力にあたっては、画像要素上またはその近傍に、リンクについての情報を埋め込んで印刷出力可能にすることが提案されている。具体的には、HTML(Hyper Text Markup Language)で記述されたハイパー文書中のURL(Uniform Resource Locator)を二次元コード化した画像に変換し、この画像を参照部分(当該URLの部分)の直後に挿入して印刷出力することが提案されている(例えば、特許文献1参照)。このようにすれば、例えば二次元コード化した画像部分をカメラで読み取り、その二次元コードを解析してURLに変換することで、そのURLによって特定されるコンテンツへのアクセスを行うことが可能となる。
また、その他にも、画像要素に関連する情報を特定するリンク情報を、当該画像要素の描画位置に少なくとも一部を重ねて埋め込むことで、どのようなハイパー文書であっても、その体裁を崩さずに、画像中に多量の情報を埋め込み可能にすることが提案されている(例えば、特許文献2参照)。
ところで、ハイパー文書を印刷出力した後においては、ハイパーリンクが指し示すコンテンツが変更されてしまうと、その印刷出力された文書画像からアクセスできるコンテンツが印刷出力時点におけるもの、すなわち期待されたものとは異なってしまうという問題が生じてしまう。例えば、図4(a)に示すようなハイパー文書を印刷出力する場合を例に挙げて考える。図例のハイパー文書では、「こちら」という文字の画像要素部分に、「https://www.abc.com/release/new.htm」というリンク情報が埋め込まれている。このようなハイパー文書を印刷出力した場合、その印刷出力画像は、図4(b)に示すように、「こちら」という文字画像21に、例えば二次元コード化されたリンク情報が上書きで重畳されたものとなる。そして、その文字画像21の部分をカメラで読み取り、二次元コードを解析してURLに変換すれば、図4(c)に示すような関連するコンテンツへのアクセスを行うことが可能となる。ところが、印刷出力日時以降、「https://www.abc.com/release/new.htm」というリンク情報が指し示すコンテンツが変更されてしまうと、その変更後に印刷出力画像の文字画像21を読み取って解析しても、図4(c)に示すコンテンツにはアクセスすることができず、図4(d)に示すような異なるコンテンツにアクセスすることになってしまう。
このことから、ハイパー文書の印刷出力にあたっては、印刷時にリンク先からコンテンツをダウンロードして管理することで、その印刷出力後にリンク先のコンテンツに変更があった場合でも、その変更の有無に拘わらず、印刷出力時点におけるコンテンツ、すなわち期待されたコンテンツにアクセスし得るようにすることも提案されている(例えば、特許文献3参照)。
特開平11-203381号公報 特開2001−177712号公報 特開2006−011777号公報
しかしながら、上述した従来技術では、ハイパー文書の特長(性質)を活かすべく、そのハイパー文書にリンク情報を埋め込んで印刷出力する場合に、リンク先のコンテンツの変更有無にも拘わらず期待されたコンテンツへのアクセスを行い得るようにするためには、ハイパー文書の印刷時にリンク先からコンテンツをダウンロードしておく必要がある。したがって、コンテンツの内容によっては、ダウンロードして管理すべきデータ量が膨大になる可能性があり、必要とするメモリ容量やコスト等の点で好ましくなく、また大規模ユーザによる運用が困難になるおそれもある。
そこで、本発明は、コンテンツをダウンロードして記憶保持することを必要とせずに、リンク先コンテンツが印刷時の内容と同一か否かをチェックし得るようにし、期待されたコンテンツへのアクセスの確実化を図ることのできる情報処理装置および情報処理プログラムを提供することを目的とする。
本発明は、上記目的を達成するために案出された情報処理装置で、文書データに関連するコンテンツを特定するための情報を当該文書データ中に埋め込んで印刷出力可能にする画像生成手段と、前記コンテンツについての特徴量情報を取得する特徴量取得手段と、前記文書データ中への情報埋め込み時点における前記コンテンツについての特徴量情報を当該文書データ中への埋め込み情報と対応付けて管理する情報管理手段とを備えることを特徴とする。
また、本発明は、上記目的を達成するために案出された情報処理プログラムで、コンピュータを、文書データに関連するコンテンツを特定するための情報を当該文書データ中に埋め込んで印刷出力可能にする画像生成手段と、前記コンテンツについての特徴量情報を取得する特徴量取得手段と、前記文書データ中への情報埋め込み時点における前記コンテンツについての特徴量情報を当該文書データ中への埋め込み情報と対応付けて管理する情報管理手段として機能させることを特徴とする。
上記構成の情報処理装置および情報処理プログラムでは、文書データに関連するコンテンツを特定するための情報(例えば、当該コンテンツについてのリンク情報)を文書データ中に埋め込んで印刷出力可能にする一方で、その文書データ中への情報埋め込み時点におけるコンテンツについての特徴量情報(例えば、当該コンテンツのハッシュ値)を、当該文書データ中への埋め込み情報と対応付けて管理しておく。したがって、印刷出力された文書中における埋め込み情報を基にして、その埋め込み情報によって特定されるコンテンツへアクセスする際に、そのアクセス時におけるコンテンツについての特徴量情報を、情報埋め込み時点における当該コンテンツについての特徴量情報と比較すれば、そのアクセス時のコンテンツが印刷出力時の内容と同一か否かをチェックし得るようになる。
本発明によれば、アクセス時のコンテンツが印刷出力時の内容と同一か否かをチェックし得るので、仮に内容が変更されていても、利用者はそのことを把握しながら誤解なくコンテンツを利用することができる。つまり、印刷出力結果である文書画像からその文書画像に関連するコンテンツへのアクセスを可能にしつつ、その際に本来取得されるべきコンテンツ、すなわち利用者の期待通りのコンテンツへのアクセスを容易に実現し得るようになるので、「紙と電子データを連携させた」情報を正確に、かつ、分かりやすく活用することができる。しかも、内容が同一か否かのチェックを、コンテンツについての特徴量情報を用いて行うので、そのコンテンツ自体をダウンロードして記憶保持しておく必要がなく、必要とするメモリ容量やコスト等を抑制することができ、またこれにより大規模ユーザによる運用が困難になるおそれも解消し得るようになる。
以下、図面に基づき本発明に係る情報処理装置および情報処理プログラムについて説明する。なお、以下に説明する実施の形態では、例えばHTMLで記述されたハイパー文書の印刷出力を行う場合を例に挙げて説明するが、本発明はハイパー文書以外の文書を印刷出力する場合であっても全く同様に適用することが可能であることは勿論である。
先ず、はじめに、情報処理装置が用いられるシステム構成例について説明する。図1は、本発明に係る情報処理装置が用いられるシステム構成例を示す説明図である。図1(a)に示すように、ここで説明する情報処理装置1は、例えばパーソナルコンピュータからなるもので、文書データの印刷出力を行うために、プリンタ装置2およびインターネット3と接続して用いられる。すなわち、情報処理装置1では、例えばHTMLで記述された文書データを受け取ると、これをハイパー文書として用紙等の記録媒体上に印刷出力するために必要な処理を行った後に、その文書データをプリンタ装置2へ送出して印刷出力させるようになっている。プリンタ装置2での印刷出力は、電子写真方式やインクジェット方式等といった周知技術を利用して行えばよく、プリンタ装置2ではなく他の画像形成装置(複写機等)を利用して行っても構わない。また、情報処理装置1への文書データの入力は、情報処理装置1でのユーザ操作を通じてデータ入力する場合や、インターネット3を介してデータ入力する場合等が考えられる。
なお、情報処理装置1は、スタンドアローンで用いることが可能であるが、図1(b)に示すように、プリントサーバとしての機能を備えたサーバ装置4を含むシステムの構築にも対応し得るものとする。すなわち、複数の情報処理装置1と、プリンタ装置2と、サーバ装置4とを含み、これらがインターネット3に接続するシステムの構築にも対応し得るようになっている。
このような情報処理装置1が受け取って処理する文書データは、ハイパー文書を印刷出力するためのもので、体裁情報およびリンク情報が含まれているものとする。
体裁情報は、テキスト、イメージ、グラフィックス等といった文書を構成する画像要素について、これらのハイパー文書上における描画位置を規定するものである。なお、体裁情報は、基本的にハイパー文書の「見え」を規定するものであるが、ハイパー文書の中には、「見え」を明確に規定せずに、例えば「段落」といったように個々の画像要素の論理的な意味づけだけを記述したものもある。通常、このようなハイパー文書に対しては、ブラウザ等が、所定の規則に基づいて、論理的情報を体裁情報に変換して表示あるいは印側を行うようになっている。すなわち、この場合、画像要素の体裁は、論理的情報を基に定められる。したがって、ここでは、論理的情報しか有しない文書データであっても、体裁を規定する情報を含んでいるとみなすこととする。
また、リンク情報は、関連するコンテンツにアクセスするためのもので、ハイパー文書上に描かれる画像要素とこれに関連するコンテンツとの間を結び付けるためのものである。「コンテンツ」には、ハイパー文書を構成する画像要素と関連する文書、画像要素、音声、映像等が含まれる。したがって、リンク情報としては、例えば、文書データがHTMLで記述されていれば、関連するコンテンツの格納場所を示すURLによって表わされるものが挙げられる。ただし、URLに限られるわけではなく、その他にも音声ファイル(音楽ファイル)、映像ファイル、アプリケーションのパラメータ等を特定するものであってもよい。また、リンク情報によっては、関連するコンテンツにアクセスして当該コンテンツを表示または再生するアプリケーションが異なってくる。例えば、URLであればブラウザが対応するが、音声ファイルであればMP3ファイルを再生するアプリケーションが対応する、といった具合である。その他にも、アプリケーションとしては、辞書ツールを起動させるアプリケーション等が挙げられる。
次に、以上のようなシステムにて用いられる情報処理装置1の機能構成例について説明する。図2は、本発明に係る情報処理装置における機能構成の第一例を示す説明図である。
図例のように、情報処理装置1では、文書データをハイパー文書として印刷出力するために、画像データ生成部11と、リンク情報抽出部12と、埋込データ生成部13と、情報埋込画像生成部14と、関連情報アクセス部15と、ハッシュ値計算部16と、リンク情報管理部17としての機能を備えている。
画像データ生成部11は、受け取った文書データに対して、その文書データにおける体裁情報に基づきレンダリングを行い、当該文書データから印刷出力可能な形式(例えばビットマップ形式)の画像データを生成するものである。
リンク情報抽出部12は、受け取った文書データから当該文書データに含まれるリンク情報を抽出するものである。
埋込データ生成部13は、リンク情報抽出部12が抽出したリンク情報について、これを印刷画像中に埋め込み可能な形式のデータに変換するものである。「印刷画像中に埋め込み可能な形式のデータ」としては、二次元コード化したものを用いることが考えられる。「二次元コード」としては、その代表的なものとして例えばバーコードが挙げられるが、これに準ずるものであっても構わない。具体的には、例えば「iTone(登録商標)」と呼ばれるもののように、階調表現としての万線スクリーンまたはドットスクリーンを構成する画素の形態(位置、形状等)を変化させることで、二次元コード化を図ったものであってもよい。すなわち、二次元コードは、リンク情報の内容をコード化した値によって、画素の位置、配置関係、幾何学的形態、あるいは複数の画素で構成するパターンを変化させるものであればよい。なお、二次元コード化の詳細については、公知技術を利用して行えばよいため、ここではその説明を省略する。
情報埋込画像生成部14は、埋込データ生成部13が生成した埋め込みデータを、画像データ生成部11が生成した画像データ中に埋め込んで、ハイパー文書としての印刷出力を可能にするものである。データ埋め込みは、文書データに含まれる体裁情報に基づいて行うことが考えられる。これにより、リンク情報は、ハイパー文書の各画像要素上に重畳させて、またはその近傍箇所に、二次元コード化されて埋め込まれることになる。なお、データ埋め込みの詳細については、公知技術を利用して行えばよいため(例えば、特許文献1または2参照)、ここではその説明を省略する。
関連情報アクセス部15は、リンク情報抽出部12がリンク情報を抽出すると、そのリンク情報によって特定されるコンテンツの所在箇所(WWWサーバ等)にアクセスして、その所在箇所から当該コンテンツをダウンロードするものである。
ハッシュ値計算部16は、関連情報アクセス部15がダウンロードしたコンテンツについての特徴量情報を取得するものであり、さらに詳しくは特徴量情報としてハッシュ値の算出を行うものである。「ハッシュ値」とは、与えられた原文から固定長の疑似乱数を生成するハッシュ関数によって算出される値で、当該原文を一意に特定する特徴量に相当するものである。このハッシュ値自体およびその算出については、公知技術を利用すればよいため、ここではその説明を省略する。なお、ハッシュ値計算部16が算出する特徴量情報は、必ずしもハッシュ値によるものである必要はない。すなわち、ハッシュ値計算部16は、コンテンツを一意に特定し得る特徴量情報を取得するものであれば、他の特徴量を取得するものであってもよい。
リンク情報管理部17は、ハッシュ値計算部16が取得した特徴量情報を、情報埋込画像生成部14によって文書データ中に埋め込まれる情報、すなわちリンク情報抽出部12が抽出したリンク情報と対応付けて、それぞれの間の対応関係を例えばテーブル形式で記憶するものである。つまり、リンク情報管理部17では、文書データ中への情報埋め込み時点におけるコンテンツについての特徴量情報と、その文書データ中への埋め込み情報とを、互いに対応付けて管理するようになっている。
これらの各部11〜17は、例えば、所定プログラムを実行するCPU(Central Processing Unit)、その所定プログラムを格納するためのROM(Read Only Memory)およびCPUのワークエリアとして用いられるRAM(Random Access Memory)等の組み合わせによって実現すればよい。すなわち、これらの各部11〜17は、情報処理装置1におけるコンピュータとしての機能が所定プログラムを実行することによって実現することが考えられる。ただし、その場合に、各部11〜17を実現する所定プログラムは、予めコ情報処理装置1内にインストールされておらずに、コンピュータ読み取り可能な記憶媒体に格納されて提供されるものであっても、または有線若しくは無線による通信手段を介して配信されるものであってもよい。つまり、上述した構成の情報処理装置1は、コンピュータを当該情報処理装置として機能させる情報処理プログラムによっても実現可能である。
次に、以上のような構成の情報処理装置(情報処理プログラムによって実現される場合を含む)における処理動作例について説明する。
この情報処理装置(情報処理プログラム)では、ハイパー文書の印刷出力処理を行うのにあたって、先ず、印刷出力すべき文書データを取得する。文書データの取得は、ホスト装置からネットワークを介して受信して行うことが考えられる。ただし、情報処理プログラムによりコンピュータを情報処理装置として機能させる場合には、例えばキーボード等の操作装置を扱う操作者が文書作成ソフトウエアまたは文書管理ソフトウエアを用いて入力してもよい。
文書データを取得した後は、画像データ生成部11が画像データを生成するとともに、リンク情報抽出部12がその文書データに含まれるリンク情報を抽出し、そのリンク情報を埋込データ生成部13が二次元コード化する。そして、情報埋込画像生成部14が画像データ中への二次元コード化データの埋め込みを行って、ハイパー文書としての印刷出力を可能にする。
その一方で、リンク情報抽出部12がリンク情報を抽出すると、関連情報アクセス部15は、その抽出されたリンク情報に基づいて、そのリンク情報によって特定されるコンテンツをダウンロードする。すなわち、関連情報アクセス部15は、ハイパー文書にリンクされているコンテンツをダウンロードするのである。なお、関連するコンテンツのダウンロードについては、公知技術を利用して行えばよいため、ここではその説明を省略する。
関連情報アクセス部15がコンテンツをダウンロードすると、続いて、ハッシュ値計算部16は、そのコンテンツについての特徴量情報として、ハッシュ値の算出を行う。そして、リンク情報管理部17は、ハッシュ値計算部16が算出したハッシュ値を、リンク情報抽出部12が抽出したリンク情報と対応付けて、これらの対応関係を記憶保持する。
ここで、リンク情報とハッシュ値との対応関係およびその管理について具体例を挙げて説明する。図3は、リンク情報とハッシュ値との対応関係の一具体例を示す説明図である。図例のように、リンク情報管理部17は、リンク情報とハッシュ値との対応関係をテーブル形式で記憶している。例えば、「https://www.abc.com/release/new.htm」というリンク情報に基づいてダウンロードされたコンテンツについて、そのハッシュ値の算出結果が「0C2A48B96048D60A9E452D59EE5744F948F908A9」であれば、それぞれが対応付けられてテーブル内に登録される。
なお、リンク情報とハッシュ値との対応関係を管理する際には、コンテンツのダウンロード日時や印刷出力日時等に関しても併せて登録管理しておけば、リンク情報管理部17における記憶領域の有効活用を図る上で非常に好適である。一般に、情報記憶領域は有限であることから、ハイパー文書の印刷出力を重ねて行うと、リンク情報とハッシュ値等の情報記憶ができなくなることも考えられる。このような場合であっても、例えばダウンロード日時や印刷出力日時等を登録管理しておけば、ダウンロード後一定期間以上経過したものや一定期間以上印刷出力されなかったもの等を、リンク情報管理部17内から削除するといったことが可能となるので、これにより有限な記憶領域の有効活用が図れるようになる。
以上のような一連の処理を経た後に印刷出力されたハイパー文書については、その印刷出力の後に、その文書画像中に埋め込まれている二次元コード化されたリンク情報を光学的に読み取って取得することで、関連するコンテンツへのアクセスを行うことが可能となる。
ただし、関連するコンテンツへのアクセスを行う際には、リンク情報管理部17がリンク情報とハッシュ値とを対応付けて管理しているので、そのリンク情報管理部17における管理情報を利用することで、そのアクセスによって得られるコンテンツの内容についての確認を行うことが可能である。すなわち、印刷出力された文書画像中に埋め込まれているリンク情報を基にして、そのリンク情報によって特定されるコンテンツへアクセスする際に、そのアクセス時に得られるコンテンツについてのハッシュ値を算出し、その算出結果をリンク情報管理部17が管理しているハッシュ値でリンク情報埋め込み時点におけるコンテンツから算出されたものと比較すれば、そのアクセス時のコンテンツが印刷出力時の内容と同一か否かをチェックし得るのである。
例えば、図4(a)に示すようなハイパー文書を印刷出力する場合を例に挙げて考える。このようなハイパー文書を印刷出力した場合、その印刷出力画像には、図4(b)に示すように、「こちら」という文字画像21の部分に「https://www.abc.com/release/new.htm」というリンク情報が二次元コード化されて上書きで重畳されたものとなる。なお、印刷出力の日時は、2005年9月25日11時23分20秒であるものとする。そして、その文字画像21の部分を光学的に読み取って、その読み取り結果からリンク情報をデコードして取得すると、そのリンク情報によって特定されるアクセス先へアクセスすることで、図4(c)に示すような文字画像21に関連するコンテンツを得ることが可能となる。
ところが、「https://www.abc.com/release/new.htm」というリンク情報が指し示すコンテンツについては、ハイパー文書の印刷出力時点以降(例えば、2005年10月2日)、その内容が更新され、図4(d)に示すように変更されてしまうこともあり得る。この点については、リンク情報管理部17における管理情報を利用することで、そのアクセスで得られるコンテンツの内容についての確認を行えばよい。
すなわち、リンク情報によって特定されるアクセス先へアクセスし、そのアクセス先から文字画像21に関連するコンテンツをダウンロードした時点で、そのコンテンツについてのハッシュ値を算出する。そして、その算出結果を、リンク情報管理部17が管理しているハッシュ値(リンク情報埋め込み時点におけるコンテンツから算出されたもの)と比較する。このとき、印刷出力時点以降にコンテンツの更新変更がなければ、それぞれのハッシュ値が一致するが、コンテンツの更新変更があった場合には、それぞれのハッシュ値が異なるものとなる。つまり、その比較結果を基にすることで、アクセス時のコンテンツが印刷出力時の内容と同一か否かをチェックし得るのである。
このチェックの結果、アクセス時におけるハッシュ値が印刷出力時のものと一致しない場合(コンテンツの内容が更新されている場合)は、そのコンテンツへのアクセスを指示した閲覧者に対して、内容が更新されていることを通知するためのポップアップダイアログ等を、アクセス先からダウンロードしたコンテンツと併せて表示出力することで、その旨を閲覧者に知らせることができる。また、ポップアップダイアログ等については、ダウンロードしたコンテンツとは別に表示出力することも考えられる。その場合には、内容が更新されている旨を閲覧者に通知して、更新後のコンテンツの表示出力を行うか否かを閲覧者に判断させ、キーボード等の操作装置を扱う閲覧者が所定操作を行った場合にのみ、ダウンロードしたコンテンツの表示出力を行い、それ以外の場合にはコンテンツを表示出力しないようにする、といったことが実現可能となる。
一方、アクセス時におけるハッシュ値が印刷出力時のものと一致する場合(コンテンツの内容が更新されていない場合)には、ポップアップダイアログ等の表示出力を行うことなく、ダウンロードしたコンテンツを表示出力することになる。したがって、そのコンテンツの閲覧者は、ポップアップダイアログ等による通知がないことから、印刷出力時点におけるコンテンツ、すなわち期待されたコンテンツにアクセスしていることを認識し得るようになる。
なお、コンテンツのダウンロード、ダウンロードしたコンテンツやポップアップダイアログ等の表示出力、閲覧者による所定操作に応じた表示切替等の詳細な手法については、公知技術を利用して実現すればよいため、ここではその説明を省略する。
このように、上述した構成の情報処理装置および情報処理プログラム並びにこれらが実行する情報処理方法によれば、リンク情報の埋め込み時点におけるコンテンツについてのハッシュ値を当該リンク情報と対応付けて管理しておき、リンク情報によって特定されるコンテンツへアクセスする際に、そのアクセス時におけるコンテンツについてのハッシュ値を、情報埋め込み時点における当該コンテンツについてのハッシュ値と比較することで、アクセス時のコンテンツが印刷出力時の内容と同一か否かをチェックすることができる。したがって、仮にコンテンツの内容が変更されていても、閲覧者はそのことを把握しながら誤解なくコンテンツを利用することができる。つまり、印刷出力結果であるハイパー文書画像からその文書画像に関連するコンテンツへのアクセスを可能にしつつ、その際に本来取得されるべきコンテンツ、すなわち利用者の期待通りのコンテンツへのアクセスを容易に実現し得るようになるので、「紙と電子データを連携させた」情報を正確に、かつ、分かりやすく活用することができるのである。
しかも、アクセス時のコンテンツが印刷出力時の内容と同一か否かのチェックを、コンテンツについてのハッシュ値を用いて行うので、そのコンテンツ自体をダウンロードして記憶保持しておく必要がなく、必要とするメモリ容量やコスト等を抑制することができる。また、ダウンロードしたコンテンツ自体の記憶保持が不要であることから、大規模ユーザによる運用が困難になることも回避し得るようになる。
次に、情報処理装置の他の構成例について説明する。図5は、本発明に係る情報処理装置における機能構成の第二例を示す説明図である。ただし、ここでは、上述した構成例との相違点についてのみ説明する。
図例のように、ここで説明する構成例は、埋込データ生成部13が、リンク情報抽出部12が抽出したリンク情報ではなく、そのリンク情報を基に関連情報アクセス部15がダウンロードしたコンテンツに対するハッシュ値計算部16でのハッシュ値の計算結果について、これを印刷画像中に埋め込み可能な形式のデータに変換する点で、上述した構成例とは異なる。これにより、情報埋込画像生成部14は、関連するコンテンツを特定するための情報として、そのコンテンツについてのハッシュ値を、ハイパー文書の印刷出力画像中に埋め込むことになる。つまり、コンテンツの内容が完全に一致しない限りハッシュ値は異なるものになるので、そのハッシュ値をリンク情報の識別子として利用するのである。
このような構成例においても、リンク情報管理部17が情報埋め込み時点におけるコンテンツについてのハッシュ値とリンク情報とを対応付けて管理しておくことで、コンテンツをダウンロードして記憶保持することを必要とせずに、アクセス時のコンテンツが印刷出力時の内容と同一か否かをチェックすることができるので、仮にコンテンツの内容が変更されていても、閲覧者はそのことを把握しながら誤解なくコンテンツを利用することができる。
しかも、ここで説明した構成例では、コンテンツを特定するための情報として、ハッシュ値を用いている。このハッシュ値は、固定長の値である。したがって、情報埋込画像生成部14が情報埋め込みを行う際に、固定長の情報を埋め込めばよいので、例えばURLのようにアクセス先によって情報量が異なる場合に比べて、情報埋め込み後における画像の体裁を良好に保つことが容易である。
次に、情報処理装置のさらに他の構成例について説明する。図6は、本発明に係る情報処理装置における機能構成の第三例を示す説明図である。ただし、ここでも、上述した構成例との相違点についてのみ説明する。
図例のように、ここで説明する構成例は、識別子取得部18が設けられている点で、上述した第一例の場合と異なる。この識別子取得部18は、リンク情報抽出部12が抽出したリンク情報について、これを一意に特定する識別子情報を生成するものである。識別子情報としては、例えばバイナリーカウンタによるカウント値を用いることが考えられる。バイナリーカウンタによるカウント値であっても、5Byte程度の情報量があれば、約1兆通りのリンク情報を識別・管理することができ、情報量としては十分である。なお、識別子取得部18についても、他の各部11〜17と同様に、所定プログラムの実行によって実現すればよい。
また、ここで説明する構成例では、識別子取得部18が設けられていることから、埋込データ生成部13が、リンク情報抽出部12が抽出したリンク情報ではなく、そのリンク情報に対応して識別子取得部18が生成した識別子情報を、埋め込み可能な形式のデータに変換するようになっている。これにより、情報埋込画像生成部14は、関連するコンテンツを特定するための情報として、そのコンテンツについてのリンク情報を一意に特定する識別子情報を、印刷出力画像中に埋め込むことになる。
さらに、ここで説明する構成例では、リンク情報管理部17が、リンク情報抽出部12が抽出したリンク情報およびハッシュ値計算部16が算出したハッシュ値に加え、識別子取得部18が生成した識別子情報についても、これらを互いに対応付けて、それぞれの間の対応関係を記憶保持するようになっている。
ここで、リンク情報とハッシュ値と識別子情報との対応関係およびその管理について具体例を挙げて説明する。図7は、リンク情報とハッシュ値と識別子情報との対応関係の他の具体例を示す説明図である。図例のように、リンク情報管理部17は、リンク情報とハッシュ値と識別子情報との対応関係をテーブル形式で記憶している。例えば、「https://www.abc.com/release/new.htm」というリンク情報について、「01000230E302」という識別子が付与された場合において、そのリンク情報に基づいてダウンロードされたコンテンツのハッシュ値の算出結果が「0C2A48B96048D60A9E452D59EE5744F948F908A9」であれば、それぞれが互いに対応付けられてテーブル内に登録されることになる。
このように、リンク情報とハッシュ値と識別子情報とを対応付けて管理すれば、コンテンツを特定するための情報として識別子情報を印刷出力画像中に埋め込んだ場合であっても、その識別子情報に対応するリンク情報およびハッシュ値を明確に特定し得るので、上述した各構成例の場合と同様に、コンテンツをダウンロードして記憶保持することを必要とせずに、アクセス時のコンテンツが印刷出力時の内容と同一か否かをチェックすることができる。したがって、仮にコンテンツの内容が変更されていても、閲覧者はそのことを把握しながら誤解なくコンテンツを利用することができる。
しかも、ここで説明した構成例では、コンテンツを特定するための情報として、リンク情報を一意に特定する識別子情報を用いているので、埋込情報量を削減したい場合に非常に有効なものとなる。すなわち、ハッシュ値は最低でも20〜30Byte以上が必要となるが、識別子情報は5Byte程度の情報量で十分であることから、ハッシュ値を埋め込む場合よりもさらに埋込情報量を削減することが可能となる。したがって、情報埋め込み後における画像の体裁を良好に保つ上で非常に好適なものとなり、例えば情報埋め込み技術として「iTone(登録商標)」を利用する場合には、コンテンツを特定するための情報として識別子情報を用いて情報埋め込みを行うことが考えられる。
なお、本実施形態では、本発明の好適な実施具体例について、第一例〜第三例を挙げて説明したが、本発明はその内容に限定されるものではなく、その要旨を逸脱しない範囲で適宜変更することが可能である。
本発明に係る情報処理装置が用いられるシステム構成例を示す説明図である。 本発明に係る情報処理装置における機能構成の第一例を示す説明図である。 リンク情報とハッシュ値との対応関係の一具体例を示す説明図である。 ハイパー文書の印刷出力画像および関連するコンテンツの具体例を示す説明図である。 本発明に係る情報処理装置における機能構成の第二例を示す説明図である。 本発明に係る情報処理装置における機能構成の第三例を示す説明図である。 リンク情報とハッシュ値との対応関係の他の具体例を示す説明図である。
符号の説明
1…情報処理装置、2…プリンタ装置、3…インターネット、4…サーバ装置、11…画像データ生成部、12…リンク情報抽出部、13…埋込データ生成部、14…情報埋込画像生成部、15…関連情報アクセス部、16…ハッシュ値計算部、17…リンク情報管理部、18…識別子取得部、21…文字画像

Claims (6)

  1. 文書データに関連するコンテンツを特定するための情報を当該文書データ中に埋め込んで印刷出力可能にする画像生成手段と、
    前記コンテンツについての特徴量情報を取得する特徴量取得手段と、
    前記文書データ中への情報埋め込み時点における前記コンテンツについての特徴量情報を当該文書データ中への埋め込み情報と対応付けて管理する情報管理手段と
    を備えることを特徴とする情報処理装置。
  2. 前記特徴量取得手段は、前記コンテンツについての特徴量情報として、当該コンテンツのハッシュ値を取得する
    ことを特徴とする請求項1記載の情報処理装置。
  3. 前記画像生成手段は、前記コンテンツを特定するための情報として、当該コンテンツについてのリンク情報を、前記文書データ中に埋め込む
    ことを特徴とする請求項1または2記載の情報処理装置。
  4. 前記画像生成手段は、前記コンテンツを特定するための情報として、当該コンテンツについての特徴量情報を、前記文書データ中に埋め込むとともに、
    前記情報管理手段は、前記文書データ中に埋め込まれた特徴量情報を、前記コンテンツについてのリンク情報と対応付けて管理する
    ことを特徴とする請求項1または2記載の情報処理装置。
  5. 前記画像生成手段は、前記コンテンツを特定するための情報として、当該コンテンツについてのリンク情報を一意に特定する識別子情報を、前記文書データ中に埋め込むとともに、
    前記情報管理手段は、前記文書データ中に埋め込まれた識別子情報を、当該識別子情報によって特定されるリンク情報と対応付けて管理する
    ことを特徴とする請求項1または2記載の情報処理装置。
  6. コンピュータを、
    文書データに関連するコンテンツを特定するための情報を当該文書データ中に埋め込んで印刷出力可能にする画像生成手段と、
    前記コンテンツについての特徴量情報を取得する特徴量取得手段と、
    前記文書データ中への情報埋め込み時点における前記コンテンツについての特徴量情報を当該文書データ中への埋め込み情報と対応付けて管理する情報管理手段
    として機能させることを特徴とする情報処理プログラム。
JP2006103028A 2006-04-04 2006-04-04 情報処理装置および情報処理プログラム Pending JP2007281673A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006103028A JP2007281673A (ja) 2006-04-04 2006-04-04 情報処理装置および情報処理プログラム
US11/636,577 US20070233661A1 (en) 2006-04-04 2006-12-11 Information processing apparatus, information processing method, storage medium and data signal
CNA2007100019648A CN101051312A (zh) 2006-04-04 2007-01-17 信息处理装置、信息处理方法和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006103028A JP2007281673A (ja) 2006-04-04 2006-04-04 情報処理装置および情報処理プログラム

Publications (1)

Publication Number Publication Date
JP2007281673A true JP2007281673A (ja) 2007-10-25

Family

ID=38560605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006103028A Pending JP2007281673A (ja) 2006-04-04 2006-04-04 情報処理装置および情報処理プログラム

Country Status (3)

Country Link
US (1) US20070233661A1 (ja)
JP (1) JP2007281673A (ja)
CN (1) CN101051312A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010015606A1 (de) 2008-08-04 2010-02-11 Roche Diagnostics Gmbh Codierungsverfahren zur codierung medizinischer artikel
JP5455456B2 (ja) * 2009-06-09 2014-03-26 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム
US8631091B2 (en) * 2010-10-15 2014-01-14 Northeastern University Content distribution network using a web browser and locally stored content to directly exchange content between users
US10474321B2 (en) 2015-11-30 2019-11-12 Snap Inc. Network resource location linking and visual content sharing

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6522770B1 (en) * 1999-05-19 2003-02-18 Digimarc Corporation Management of documents and other objects using optical devices
US20020170966A1 (en) * 1995-07-27 2002-11-21 Hannigan Brett T. Identification document including embedded data
US5933851A (en) * 1995-09-29 1999-08-03 Sony Corporation Time-stamp and hash-based file modification monitor with multi-user notification and method thereof
JP2958396B2 (ja) * 1995-12-20 1999-10-06 富士ゼロックス株式会社 画像形成装置
US5870767A (en) * 1996-11-22 1999-02-09 International Business Machines Corporation Method and system for rendering hyper-link information in a printable medium from a graphical user interface
JP3634099B2 (ja) * 1997-02-17 2005-03-30 株式会社リコー 文書情報管理システム,媒体用紙情報作成装置および文書情報管理装置
US6188766B1 (en) * 1997-03-05 2001-02-13 Cryptography Research, Inc. Apparatus and method for confirming, timestamping, and archiving printer and telecopier transmissions
JPH1153168A (ja) * 1997-08-07 1999-02-26 Matsushita Graphic Commun Syst Inc 音声情報付文書作成装置及びこれを用いた方法
US6638314B1 (en) * 1998-06-26 2003-10-28 Microsoft Corporation Method of web crawling utilizing crawl numbers
US7038797B1 (en) * 1999-05-25 2006-05-02 Silverbrook Research Pty Ltd Method and system for delivery of mail
US6764009B2 (en) * 2001-05-30 2004-07-20 Lightwaves Systems, Inc. Method for tagged bar code data interchange
US6499665B1 (en) * 2000-08-21 2002-12-31 Xerox Corporation Method for indexing and retrieval of physical documents
US6804700B1 (en) * 2000-10-04 2004-10-12 Microsoft Corporation Methods and systems for assigning human-readable and unique uniform resource locators to objects
US6940491B2 (en) * 2000-10-27 2005-09-06 International Business Machines Corporation Method and system for generating hyperlinked physical copies of hyperlinked electronic documents
US20020143814A1 (en) * 2001-03-27 2002-10-03 The Code Corporation Systems and methods for automatic insertion of machine-readable graphical codes into printable documents
US20030028494A1 (en) * 2001-08-06 2003-02-06 King Shawn L. Electronic document management system and method
US20030229857A1 (en) * 2002-06-05 2003-12-11 Fuji Xerox Co., Ltd. Apparatus, method, and computer program product for document manipulation which embeds information in document data
US20040054627A1 (en) * 2002-09-13 2004-03-18 Rutledge David R. Universal identification system for printed and electronic media
JP3991836B2 (ja) * 2002-10-04 2007-10-17 富士ゼロックス株式会社 画像形成装置
US20050120290A1 (en) * 2003-12-01 2005-06-02 Information Handling Services Inc. Page rendered electronic file processing
US20050125722A1 (en) * 2003-12-01 2005-06-09 Information Handling Services Inc. Unreferenced object in page rendered electronic file
US7519726B2 (en) * 2003-12-12 2009-04-14 International Business Machines Corporation Methods, apparatus and computer programs for enhanced access to resources within a network
US7809700B2 (en) * 2004-04-09 2010-10-05 Capital One Financial Corporation Methods and systems for verifying the accuracy of reported information
JP4631398B2 (ja) * 2004-11-04 2011-02-16 富士ゼロックス株式会社 文書管理装置、および文書管理方法、並びにコンピュータ・プログラム
US8570586B2 (en) * 2005-05-02 2013-10-29 Digimarc Corporation Active images through digital watermarking

Also Published As

Publication number Publication date
CN101051312A (zh) 2007-10-10
US20070233661A1 (en) 2007-10-04

Similar Documents

Publication Publication Date Title
US7865042B2 (en) Document management method using barcode to store access history information
US8045198B2 (en) System and method for processing a change history of a PDF file
KR20090079837A (ko) 텍스트 정보를 활용하는 전자 서적 서비스 제공 방법 및 그시스템
JP2007203634A (ja) コード情報の印刷装置、印刷方法、復元装置および復元方法
JP2007281673A (ja) 情報処理装置および情報処理プログラム
US20170041494A1 (en) Digital content access using a machine -readable link
KR102042722B1 (ko) 전자책 컨텐츠 보호
JP2007257069A (ja) ウェブページ印刷方法,画像形成装置及び画像処理プログラム
JP2007174616A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体
JP2007060355A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2012015775A (ja) 画像処理装置
JP2009020553A (ja) 電子ファイル管理装置および電子ファイル管理プログラム
CN104424619A (zh) 信息处理设备和信息处理方法
JP5373439B2 (ja) 著作物比較システム
JP2006011777A (ja) 文書管理装置、文書管理方法および文書管理プログラム
JP2008283314A (ja) 情報出力処理システム、画像形成装置、情報出力処理方法及び情報出力処理プログラム
CN106133679B (zh) 获取打印内容的链接版本的方法和装置
JP2007179228A (ja) 履歴管理装置、履歴管理装置の制御方法、および履歴管理装置の制御プログラム
JP2005311942A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP5673128B2 (ja) 可変印刷検査装置及び可変印刷検査プログラム
JP2006011778A (ja) 文書管理装置、文書管理方法および文書管理プログラム
JP2008097066A (ja) 電子文書登録システム、方法及び端末装置
JP2010102644A (ja) 文書管理システム、画像形成装置、文書管理方法、文書管理プログラム
JP5552893B2 (ja) 情報処理装置
US7386788B2 (en) Data structure, processing method of structured document described using that data structure, program for implementing the method, and storage medium storing the program