JP2011076139A - Document management device, information processing apparatus, system and program for managing document - Google Patents

Document management device, information processing apparatus, system and program for managing document Download PDF

Info

Publication number
JP2011076139A
JP2011076139A JP2009223729A JP2009223729A JP2011076139A JP 2011076139 A JP2011076139 A JP 2011076139A JP 2009223729 A JP2009223729 A JP 2009223729A JP 2009223729 A JP2009223729 A JP 2009223729A JP 2011076139 A JP2011076139 A JP 2011076139A
Authority
JP
Japan
Prior art keywords
document
data
hash value
information processing
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009223729A
Other languages
Japanese (ja)
Inventor
Kenji Fukutome
憲治 福留
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2009223729A priority Critical patent/JP2011076139A/en
Publication of JP2011076139A publication Critical patent/JP2011076139A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To avoid deterioration of performance, in a document management system including a document management device and an information processing apparatus mutually connected through a network in a data-communicable manner, by enhancing the efficiency of document data identity determination processing performed to determine the necessity of update when document data retained by the information processing apparatus are updated. <P>SOLUTION: The document management device 1 is connected to the information processing apparatus 11 through the network in a data-communicable manner, and manages document data composed of a plurality of document components while sharing it with the information processing apparatus. The document management device generates a hash value corresponding to the content of each document component that is a transmission object, further integrates the hash values to generate an integrated hash value, and performs, when document data retained in the information processing apparatus 11 is used, identity determination for the document data by comparison of the hash value and integrated hash value. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、文書管理装置、情報処理装置、文書管理システム、および文書管理プログラムに関し、特に文書データを共有する場合の文書データの管理を行うための技術に関する。   The present invention relates to a document management apparatus, an information processing apparatus, a document management system, and a document management program, and more particularly to a technique for managing document data when document data is shared.

データ管理システムには従来から、データを管理するサーバと、当該サーバにネットワークを介してデータ通信可能に接続されたクライアントとによって構成される、クライアント・サーバ型のデータ管理システムが存在する。また、このようなデータ管理システムには、サーバで管理されるデータと同じデータをクライアントでも保持し、サーバで管理されるデータが更新された場合に、クライアントが保持するデータの更新を行うものが存在する。そしてこのような更新を行う場合、サーバとクライアントとの間でデータの送受信を行うことになるので、更新の回数が増大すれば、ネットワークのトラフィックに大きな負担がかかり、文書管理システムのパフォーマンスが低下する。そこで、このような更新を行う際に、予めデータの内容の同一性を判別して、更新対象となるデータの内容が同一である場合にまで更新を行わないようにし、無駄なデータの送受信を防止してデータ管理システムのパフォーマンスの低下を回避する技術が存在する(例えば、特許文献1)。   2. Description of the Related Art Conventionally, there is a client / server type data management system that includes a server that manages data and a client that is connected to the server via a network so that data communication is possible. In such a data management system, the same data as the data managed by the server is held by the client, and when the data managed by the server is updated, the data held by the client is updated. Exists. When such updates are performed, data is transmitted and received between the server and the client, so if the number of updates increases, the network traffic is overwhelmed and the performance of the document management system decreases. To do. Therefore, when performing such an update, the identity of the contents of the data is determined in advance so that the update is not performed until the contents of the data to be updated are the same. There is a technique for preventing the deterioration of the performance of the data management system (for example, Patent Document 1).

特開2003−122618号公報JP 2003-122618 A

例えば、上記特許文献1では、自機が保持するマスターデータベースの列データからダイジェストデータを作成することができるサーバを備えるデータベースダウンロードシステムにおいて、最新のダイジェストデータと、クライアントによる直近の列データダウンロード時のダイジェストデータとを比較することにより、マスターデータベースの列データが直近のダウンロード時から更新されているか否かを判断する技術が開示されている。   For example, in Patent Document 1, in a database download system including a server that can create digest data from column data of a master database held by the own device, the latest digest data and the latest column data downloaded by a client are recorded. A technique for determining whether or not the column data of the master database has been updated since the most recent download by comparing with the digest data is disclosed.

とこで、上記クライアント・サーバ型のデータ管理システムには、サーバが文書管理装置であり、クライアントが情報処理装置であって、管理対象が文書データであるような文書管理システムが存在する。このような文書管理システムにおいては、近年におけるパーソナルコンピュータの所有率の増加や、携帯性に優れるパーソナルコンピュータの普及により、クライアントである情報処理装置の台数が増加する傾向にある。従って、情報処理装置が保持するデータの更新を文書管理装置に対して要求することができる文書管理システムであれば、情報処理装置から文書管理装置に対して、非常に多くの更新要求が行われることになる。   In the client / server type data management system, there is a document management system in which a server is a document management apparatus, a client is an information processing apparatus, and a management target is document data. In such a document management system, the number of information processing apparatuses serving as clients tends to increase due to the recent increase in ownership of personal computers and the spread of personal computers with excellent portability. Therefore, if the document management system can request the document management apparatus to update the data held by the information processing apparatus, a large number of update requests are made from the information processing apparatus to the document management apparatus. It will be.

このような環境下では、上述したような、情報処理装置が保持する文書データの更新を行う際に更新対象となる文書データの内容が同一である場合にまで文書データの更新を行わないようにするため、データの内容の同一性を判別する技術が適用されることも多い。このような技術が適用されれば、文書管理システムのパフォーマンスの低下はある程度回避される。しかし、それでも、少なくともその更新要求のたびに、文書管理装置と情報処理装置との間で、更新対象となるデータのやりとりを行い、それぞれが保持しているデータの中身を解析して同一性の判別を行う必要がある。ゆえに、上述のような文書管理システムにおいては、データ同一性の判別処理そのものが大きな負担となる。   In such an environment, when updating the document data held by the information processing apparatus as described above, the document data is not updated until the contents of the document data to be updated are the same. Therefore, a technique for determining the identity of data contents is often applied. If such a technique is applied, the performance degradation of the document management system is avoided to some extent. However, at least for each update request, the document management device and the information processing device exchange data to be updated, analyze the contents of the data held by each, and verify the identity. It is necessary to make a determination. Therefore, in the document management system as described above, the data identity discrimination process itself is a heavy burden.

このような判別処理に関して、従来から、データが持つ更新日付を用いてデータの内容を判別する技術がある。すなわち、文書管理装置が保持するデータと情報処理装置が保持するデータの更新日付を比較し、データが持つ更新日付が同じであるなら、データの内容が同じであるものと判断して、文書管理装置から情報処理装置へデータの送信を行わないようにし、データが持つ更新日付が異なるならば、データの内容が異なるものであると判断して、データの送信を行う、というものである。この技術では、判別を行うために、文書管理装置と情報処理装置との間で、更新対象となるデータそのものではなく、更新日付データのみを送受信すればよいので、文書管理システムにかかる負担は大きく抑えられることになる。   Conventionally, there is a technique for discriminating the contents of data using the update date of the data. That is, the update date of the data held by the document management device is compared with the update date of the data held by the information processing device, and if the update date held by the data is the same, the content of the data is determined to be the same, and the document management Data is not transmitted from the apparatus to the information processing apparatus, and if the update date of the data is different, it is determined that the data content is different, and the data is transmitted. In this technology, in order to perform the determination, it is only necessary to transmit / receive only the update date data, not the data to be updated, between the document management apparatus and the information processing apparatus. It will be suppressed.

しかし、このような技術にも、次の2つの問題点がある。第1に、例えば、ひとつのフォルダに複数の文書データが記憶されている場合、それら複数の文書データの全てについて同一性の判別を行う際には複数の文書データのそれぞれについて更新日付の比較を行わなければならない。そのため、フォルダに格納される文書データの数が多くなればなるほど、更新日付の送受信回数や比較回数が増大し、文書管理システムにおける処理負担が大きくなる。また例えば、ひとつの文書データが複数の文書構成要素から構成される場合にも同様のことが言える。すなわち、ひとつの文書データの同一性を判断する際には複数の文書構成要素のそれぞれについて更新日付の比較を行わなければならないため、文書データを構成する文書構成要素の数が多くなればなるほど、更新日付の比較回数が増大し、処理負担が増大するという問題がある。第2に、データの更新日付が異なっても、データの内容が同じである場合があり、このような場合、文書管理装置と情報処理装置との間で無駄なデータの送受信が行われ、文書管理システムの処理負担が増大するという問題がある。   However, this technique also has the following two problems. First, for example, when a plurality of document data is stored in one folder, when the identity of all the plurality of document data is determined, the update dates are compared for each of the plurality of document data. It must be made. For this reason, the greater the number of document data stored in the folder, the greater the number of transmission / reception of the update date and the number of comparisons, and the greater the processing load on the document management system. For example, the same can be said when one document data is composed of a plurality of document components. In other words, when determining the identity of one document data, it is necessary to compare the update date for each of a plurality of document components, the more the number of document components constituting the document data, There is a problem in that the number of comparisons of update dates increases and the processing load increases. Second, even if the data update date is different, the data contents may be the same. In such a case, useless data transmission / reception is performed between the document management apparatus and the information processing apparatus, and the document There is a problem that the processing load of the management system increases.

上記第2の問題点に関して、例えば特許文献1のように、データの内容に対応したダイジェストデータを比較してデータ内容の同一性を判別する技術によれば、解決することが可能である。しかし、そのような技術であっても、上記第1の問題点を解決できない。すなわち、文書データが複数の文書構成要素から構成されており、かつそのような文書構成要素の数が多い場合には、ダイジェストデータの比較回数も多くなり、文書データが全体として同一であるか否かを判別する際には効率的な判別が行えず、文書管理システムに負担をかけることになる。   The second problem can be solved by a technique for comparing the digest data corresponding to the data contents and determining the identity of the data contents as in Patent Document 1, for example. However, even such a technique cannot solve the first problem. That is, when the document data is composed of a plurality of document components and the number of such document components is large, the number of comparisons of digest data increases, and whether the document data is the same as a whole. When this is determined, efficient determination cannot be performed, which places a burden on the document management system.

本発明は、上記2つの問題点を解決するためになされたものであり、情報処理装置が保持する文書データの更新の際に行われる、送信対象の文書データの内容の同一性を判別する処理において、文書管理装置と情報処理装置との間で無駄なデータの送受信を行わないようにするとともに、データの比較回数を抑えることによって、文書管理システムのパフォーマンス低下を回避するようにした文書管理装置、情報処理装置、文書管理システム、文書管理プログラム、および情報処理プログラムを提供することを目的としている。   The present invention has been made to solve the above two problems, and is a process for determining the identity of the content of document data to be transmitted, which is performed when document data held by the information processing apparatus is updated. Management apparatus that prevents unnecessary data transmission / reception between the document management apparatus and the information processing apparatus and avoids a decrease in the performance of the document management system by suppressing the number of data comparisons An object of the present invention is to provide an information processing apparatus, a document management system, a document management program, and an information processing program.

上記目的を達成するため、請求項1にかかる発明は、所定の記憶部に複数の文書データを記憶する文書データ記憶手段を有し、ネットワークを介して接続された情報処理装置とデータ通信を行うことによって前記記憶部に記憶された複数の文書データと、前記情報処理装置における所定の記憶領域に記憶された複数の文書データとの同一性を保持するように管理する文書管理装置であって、前記記憶部に記憶された各文書データの内容に対応した文書ダイジェストデータを生成し、前記記憶部に記憶された複数の文書データのそれぞれから生成した複数の文書ダイジェストデータに基づいて、前記複数の文書ダイジェストデータの内容に対応した合成ダイジェストデータを生成する統合ダイジェストデータ生成手段と、前記記憶部に記憶された複数の文書データと、前記所定の記憶領域に記憶された複数の文書データとで内容が異なるものが存在するか否かを、前記統合ダイジェストデータ生成手段により生成された合成ダイジェストデータの比較により判定するデータ判別手段と、を備えることを特徴とする構成である。   To achieve the above object, the invention according to claim 1 includes document data storage means for storing a plurality of document data in a predetermined storage unit, and performs data communication with an information processing apparatus connected via a network. A document management apparatus that manages the plurality of document data stored in the storage unit and the plurality of document data stored in a predetermined storage area in the information processing apparatus so as to maintain the same. Generate document digest data corresponding to the contents of each document data stored in the storage unit, and based on the plurality of document digest data generated from each of the plurality of document data stored in the storage unit, Integrated digest data generating means for generating composite digest data corresponding to the contents of the document digest data, and stored in the storage unit Judgment is made by comparing the composite digest data generated by the integrated digest data generation means whether there are different contents between the plurality of document data and the plurality of document data stored in the predetermined storage area. And a data discriminating means.

また請求項2にかかる発明は、請求項1記載の文書管理装置において、前記データ判別手段は、前記記憶部に記憶された複数の文書データのうち、前記所定の記憶領域に記憶された文書データと内容が異なるものを、前記統合ダイジェストデータ生成手段により生成された文書ダイジェストデータの比較により特定することを特徴とする構成である。   According to a second aspect of the present invention, in the document management apparatus according to the first aspect, the data discriminating unit stores the document data stored in the predetermined storage area among the plurality of document data stored in the storage unit. What is different from the contents is specified by comparing the document digest data generated by the integrated digest data generating means.

また請求項3にかかる発明は、請求項1または2に記載の文書管理装置において、前記記憶部に記憶される文書データは、複数の文書構成要素から構成されており、各文書構成要素の内容に対応したダイジェストデータを生成するダイジェストデータ生成手段を更に備え、前記統合ダイジェストデータ生成手段は、前記記憶部に記憶された文書データを構成する複数の文書構成要素のそれぞれから生成した複数のダイジェストデータに基づいて、各文書データの内容に対応した文書ダイジェストデータを生成することを特徴とする構成である。   According to a third aspect of the present invention, in the document management apparatus according to the first or second aspect, the document data stored in the storage unit is composed of a plurality of document components, and the contents of each document component A digest data generating unit that generates digest data corresponding to the document data, wherein the integrated digest data generating unit generates a plurality of digest data generated from each of a plurality of document constituent elements constituting the document data stored in the storage unit. Based on the above, document digest data corresponding to the contents of each document data is generated.

また請求項4にかかる発明は、請求項3に記載の文書管理装置において、前記データ判別手段は、前記記憶部に記憶された文書データを構成する複数の文書構成要素のうち、前記所定の記憶領域に記憶された文書データを構成する文書構成要素と内容が異なるものを、前記ダイジェストデータ生成手段により生成されたダイジェストデータの比較により特定することを特徴とする構成である。   According to a fourth aspect of the present invention, in the document management apparatus according to the third aspect, the data discriminating unit is configured to store the predetermined storage among the plurality of document constituent elements constituting the document data stored in the storage unit. What is different from the document constituent elements constituting the document data stored in the area is specified by comparing the digest data generated by the digest data generating means.

また請求項5にかかる発明は、所定の記憶部に複数の文書データを記憶する文書データ記憶手段を有し、ネットワークを介して接続された情報処理装置とデータ通信を行うことによって前記記憶部に記憶された複数の文書データと、前記情報処理装置における所定の記憶領域に記憶された複数の文書データとの同一性を保持するように管理する文書管理装置であって、前記記憶部に記憶された各文書データの内容に対応した文書ダイジェストデータを生成し、前記記憶部に記憶された複数の文書データのそれぞれから生成した複数の文書ダイジェストデータに基づいて、前記複数の文書ダイジェストデータの内容に対応した合成ダイジェストデータを生成する統合ダイジェストデータ生成手段と、前記記憶部に記憶された複数の文書データと、前記所定の記憶領域に記憶された複数の文書データとで内容が異なるものが存在するか否かを、前記統合ダイジェストデータ生成手段により生成された合成ダイジェストデータの比較により判定させるために、前記情報処理装置に対して前記合成ダイジェストデータを送信するデータ送信手段と、を備えることを特徴とする構成である。   According to a fifth aspect of the present invention, there is provided document data storage means for storing a plurality of document data in a predetermined storage unit, and the storage unit is configured to perform data communication with an information processing apparatus connected via a network. A document management device that manages a plurality of stored document data and a plurality of document data stored in a predetermined storage area in the information processing device so as to maintain the same, and is stored in the storage unit The document digest data corresponding to the contents of each document data is generated, and based on the plurality of document digest data generated from each of the plurality of document data stored in the storage unit, the contents of the plurality of document digest data are changed. Integrated digest data generating means for generating corresponding composite digest data, and a plurality of document data stored in the storage unit; In order to determine whether there is a different content from the plurality of document data stored in the predetermined storage area by comparing the composite digest data generated by the integrated digest data generation unit, the information And a data transmission means for transmitting the combined digest data to a processing device.

また請求項6にかかる発明は、請求項5に記載の文書管理装置とネットワークを介してデータ通信可能に接続される情報処理装置であって、所定の記憶領域に複数の文書データを記憶するデータ記憶手段と、前記文書管理装置における所定の記憶部に記憶されている複数の文書データと、前記所定の記憶領域に記憶されている複数の文書データとで内容が異なるものが存在するか否かを、前記文書管理装置において生成された合成ダイジェストデータの比較により判定するデータ判別手段と、を備えることを特徴とする構成である。   According to a sixth aspect of the present invention, there is provided an information processing apparatus connected to the document management apparatus according to the fifth aspect of the present invention via a network so as to be capable of data communication, wherein the data stores a plurality of document data in a predetermined storage area. Whether there are different contents between the storage means, the plurality of document data stored in the predetermined storage unit of the document management apparatus, and the plurality of document data stored in the predetermined storage area And a data discriminating means for judging by comparing the composite digest data generated in the document management apparatus.

また請求項7にかかる発明は、情報処理装置と文書管理装置とがネットワークを介して相互にデータ通信可能に接続され、前記情報処理装置と前記文書管理装置とのそれぞれで保持される複数の文書データの同一性を保持するように管理する文書管理システムであって、前記文書管理装置は、所定の記憶部に複数の文書データを記憶する文書データ記憶手段と、前記記憶部に記憶される各文書データの内容に対応した文書ダイジェストデータを生成し、前記記憶部に記憶される複数の文書データのそれぞれから生成した複数の文書ダイジェストデータに基づいて、前記複数の文書ダイジェストデータの内容に対応した合成ダイジェストデータを生成する統合ダイジェストデータ生成手段と、を備え、前記情報処理装置は、所定の記憶領域に複数に文書データを記憶するデータ記憶手段を備え、前記文書管理装置および前記情報処理装置の少なくとも一方は、前記記憶部に記憶されている複数の文書データと、前記記憶領域に記憶されている複数の文書データとで内容が異なるものが存在するか否かを、前記統合ダイジェストデータ生成手段により生成される合成ダイジェストデータの比較により判定するデータ判別手段を備えることを特徴とする構成である。   According to a seventh aspect of the present invention, there is provided a plurality of documents in which an information processing apparatus and a document management apparatus are connected to each other via a network so as to be able to perform data communication with each other, and are held by each of the information processing apparatus and the document management apparatus. A document management system that manages data so as to maintain the sameness, wherein the document management device includes a document data storage unit that stores a plurality of document data in a predetermined storage unit, and each of the storage units stored in the storage unit Document digest data corresponding to the content of the document data is generated, and based on the plurality of document digest data generated from each of the plurality of document data stored in the storage unit, the content of the plurality of document digest data is supported Integrated digest data generation means for generating composite digest data, and the information processing apparatus stores the composite digest data in a predetermined storage area. And at least one of the document management device and the information processing device includes a plurality of document data stored in the storage unit and a plurality of document data stored in the storage area. It is a configuration characterized by comprising data discriminating means for judging whether there is a document whose content differs from that of the document data by comparing the synthesized digest data generated by the integrated digest data generating means.

また請求項8にかかる発明は、所定の記憶部に複数の文書データを記憶する文書データ記憶手段を有する文書管理装置によって実行され、ネットワークを介して前記文書管理装置に接続された情報処理装置とデータ通信を行うことによって前記記憶部に記憶された複数の文書データと、前記情報処理装置における所定の記憶領域に記憶された複数の文書データとの同一性を保持するための文書管理プログラムであって、前記文書管理装置に、前記記憶部に記憶された各文書データの内容に対応した文書ダイジェストデータを生成するステップと、前記記憶部に記憶された複数の文書データのそれぞれから生成された複数の文書ダイジェストデータに基づいて、前記複数の文書ダイジェストデータの内容に対応した合成ダイジェストデータを生成するステップと、前記記憶部に記憶されている複数の文書データと、前記所定の記憶領域に記憶されている複数の文書データとで内容が異なるものが存在するか否かを、前記合成ダイジェストデータの比較により判定するステップと、を実行させることを特徴とする構成である。   According to an eighth aspect of the present invention, there is provided an information processing apparatus which is executed by a document management apparatus having document data storage means for storing a plurality of document data in a predetermined storage unit and connected to the document management apparatus via a network. A document management program for maintaining identity between a plurality of document data stored in the storage unit and a plurality of document data stored in a predetermined storage area in the information processing apparatus by performing data communication. Generating a document digest data corresponding to the content of each document data stored in the storage unit in the document management device, and a plurality of document data generated from each of the plurality of document data stored in the storage unit On the basis of the document digest data, composite digest data corresponding to the contents of the plurality of document digest data is generated. Whether or not there is a different content between the plurality of document data stored in the storage unit and the plurality of document data stored in the predetermined storage area. And a step of determining by comparing the two.

また請求項9にかかる発明は、所定の記憶部に複数の文書データを記憶する文書データ記憶手段を有する文書管理装置によって実行され、ネットワークを介して前記文書管理装置に接続された情報処理装置とデータ通信を行うことによって前記記憶部に記憶された複数の文書データと、前記情報処理装置における所定の記憶領域に記憶された複数の文書データとの同一性を保持するための文書管理プログラムであって、前記文書管理装置に、前記記憶部に記憶された各文書データの内容に対応した文書ダイジェストデータを生成するステップと、前記記憶部に記憶された複数の文書データのそれぞれから生成された複数の文書ダイジェストデータに基づいて、前記複数の文書ダイジェストデータの内容に対応した合成ダイジェストデータを生成するステップと、前記記憶部に記憶されている複数の文書データと、前記所定の記憶領域に記憶されている複数の文書データとで内容が異なるものが存在するか否かを、前記合成ダイジェストデータの比較により判定させるために、前記情報処理装置に対して前記合成ダイジェストデータを送信するステップと、を実行させることを特徴とする構成である。   The invention according to claim 9 is an information processing apparatus that is executed by a document management apparatus having a document data storage unit that stores a plurality of document data in a predetermined storage unit, and that is connected to the document management apparatus via a network. A document management program for maintaining identity between a plurality of document data stored in the storage unit and a plurality of document data stored in a predetermined storage area in the information processing apparatus by performing data communication. Generating a document digest data corresponding to the content of each document data stored in the storage unit in the document management device, and a plurality of document data generated from each of the plurality of document data stored in the storage unit On the basis of the document digest data, composite digest data corresponding to the contents of the plurality of document digest data is generated. Whether or not there is a different content between the plurality of document data stored in the storage unit and the plurality of document data stored in the predetermined storage area. In order to make a determination based on the comparison, the step of transmitting the synthesized digest data to the information processing apparatus is executed.

本発明によれば、情報処理装置が保持するデータの更新の際に行われる、送信対象のデータの内容の同一性を判別する処理において、送信対象のデータの内容に対応したダイジェストデータを統合して生成する文書ダイジェストデータおよび合成ダイジェストデータを判定に用いることにより、文書管理装置と情報処理装置との間で無駄なデータの送受信を行わないようにするとともに、データの比較回数を抑えることができる。それ故、文書管理システムのパフォーマンス低下を回避することが可能となる。   According to the present invention, digest data corresponding to the content of the data to be transmitted is integrated in the process of determining the identity of the content of the data to be transmitted, which is performed when the data held by the information processing apparatus is updated. By using the document digest data and composite digest data generated in this way for the determination, it is possible to prevent unnecessary data transmission / reception between the document management apparatus and the information processing apparatus and to reduce the number of data comparisons. . Therefore, it is possible to avoid the performance degradation of the document management system.

文書管理システムの一構成例を示す図である。It is a figure which shows the example of 1 structure of a document management system. 文書データの一例を示す図である。It is a figure which shows an example of document data. 文書管理装置のハードウェア構成の一例を示すブロック図である。It is a block diagram which shows an example of the hardware constitutions of a document management apparatus. 情報処理装置のハードウェア構成の一例を示すブロック図である。It is a block diagram which shows an example of the hardware constitutions of information processing apparatus. 文書管理装置の制御部がプログラムを実行することによって実現される詳細な機能構成を示すブロック図である。It is a block diagram which shows the detailed functional structure implement | achieved when the control part of a document management apparatus performs a program. 文書構成要素のハッシュ値および文書データの文書ハッシュ値生成の概念図である。It is a conceptual diagram of the generation of the hash value of the document component and the document hash value of the document data. フォルダのフォルダハッシュ値生成の概念図である。It is a conceptual diagram of folder hash value generation of a folder. 情報処理装置の制御部がシステムプログラムおよびアプリケーションプログラムを実行することによって実現される詳細な機能構成を示すブロック図である。It is a block diagram which shows the detailed functional structure implement | achieved when the control part of information processing apparatus runs a system program and an application program. 文書管理装置が情報処理装置から文書構成要素を受信する場合の処理手順の一例を示すフローチャートである。10 is a flowchart illustrating an example of a processing procedure when a document management apparatus receives a document component from an information processing apparatus. 文書管理装置が情報処理装置からハッシュ値・統合ハッシュ値要求を受信する場合の処理手順の一例を示すフローチャートである。10 is a flowchart illustrating an example of a processing procedure when a document management apparatus receives a hash value / integrated hash value request from an information processing apparatus. 情報処理装置においてユーザがフォルダをクリックする場合の処理手順の一例を示すフローチャートである。10 is a flowchart illustrating an example of a processing procedure when a user clicks a folder in the information processing apparatus. データ判定処理の詳細な処理手順の一例を示すフローチャートである。It is a flowchart which shows an example of the detailed process sequence of a data determination process. データ判別処理を、具体例により説明するための図である。It is a figure for demonstrating a data discrimination | determination process by a specific example. データ判別処理を、具体例により説明するための図である。It is a figure for demonstrating a data discrimination | determination process by a specific example. データ判別処理を、具体例により説明するための図である。It is a figure for demonstrating a data discrimination | determination process by a specific example.

以下、本発明に関する好ましい実施形態について図面を参照しつつ詳細に説明する。尚、以下に説明する実施形態において互いに共通する部材には同一符号を付しており、それらについての重複する説明は省略する。   Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings. In the embodiments described below, members that are common to each other are denoted by the same reference numerals, and redundant descriptions thereof are omitted.

図1は、本実施形態における文書管理システムの一構成例を示す図である。この文書管理システムは、いわゆるクライアント・サーバ型の文書管理システムであり、サーバとして機能する文書管理装置1と、クライアントとして機能する複数の情報処理装置11(11a、11b、・・・)とを備えている。文書管理装置1および複数の情報処理装置11のそれぞれは、LANやWANなどのネットワーク10を介して相互にデータ通信可能に接続されている。   FIG. 1 is a diagram illustrating a configuration example of a document management system according to the present embodiment. This document management system is a so-called client-server type document management system, and includes a document management apparatus 1 that functions as a server and a plurality of information processing apparatuses 11 (11a, 11b,...) That function as clients. ing. The document management apparatus 1 and the plurality of information processing apparatuses 11 are connected to each other via a network 10 such as a LAN or a WAN so as to be able to perform data communication with each other.

文書管理システムは、文書管理装置1と情報処理装置11とで同一の文書データを保持し、文書管理装置1で保持する文書データが更新されると、情報処理装置11がその更新された文書データを文書管理装置1からダウンロードすることにより、文書管理装置1と情報処理装置11とのそれぞれで保持される文書データの整合性を保持するように構成される。それ故、文書管理装置1は、ネットワーク10を介して、情報処理装置11において保持される文書データに対応した文書データを保持する。ここで、文書管理装置1に保持される文書データと、情報処理装置11に保持される文書データとの対応関係は、文書データの所定のプロパティ、例えばファイル名などによって判断される。つまり、文書管理装置1に保持される文書データのプロパティと、情報処理装置11に保持される文書データのプロパティとが互いに一致すれば、それらの文書データは互いに対応するデータである。   In the document management system, the document management apparatus 1 and the information processing apparatus 11 hold the same document data, and when the document data held by the document management apparatus 1 is updated, the information processing apparatus 11 updates the updated document data. Is downloaded from the document management apparatus 1 so that the consistency of the document data held in each of the document management apparatus 1 and the information processing apparatus 11 is maintained. Therefore, the document management apparatus 1 holds document data corresponding to the document data held in the information processing apparatus 11 via the network 10. Here, the correspondence between the document data held in the document management apparatus 1 and the document data held in the information processing apparatus 11 is determined by a predetermined property of the document data, such as a file name. In other words, if the properties of the document data held in the document management device 1 and the properties of the document data held in the information processing device 11 match each other, the document data are data corresponding to each other.

図1の例では、文書管理装置1は文書データ100aを保持している。このとき、情報処理装置11aは、文書データ100aと同一プロパティを有する文書データ100bを保持し、情報処理装置11bは、文書データ100aと所定の同一プロパティを有する文書データ100cを保持する。この場合、文書管理装置1に保持される文書データ100aと、情報処理装置11a,11aのそれぞれで保持される文書データ100b,100cとは互いに対応するデータである。   In the example of FIG. 1, the document management apparatus 1 holds document data 100a. At this time, the information processing apparatus 11a holds document data 100b having the same property as the document data 100a, and the information processing apparatus 11b holds document data 100c having the same property as the document data 100a. In this case, the document data 100a held in the document management apparatus 1 and the document data 100b and 100c held in the information processing apparatuses 11a and 11a are data corresponding to each other.

図2は、本実施形態における文書データ100の一例を示す図である。ここで、文書データ100は、文書管理装置1で保持される文書データ100aおよび情報処理装置11a,11aのそれぞれで保持される文書データ100b,100cを総称するものである。この文書データ100は、複数の文書構成要素190から構成される。文書構成要素190として、例えば文書本体データ101や、サムネイル102や、データベース103や、およびセキュリティ情報104などが挙げられる。文書本体データ101とは、例えばテキストファイルなどの文書ファイル本体のことをいう。サムネイル102は、文書本体データ101のサムネイルデータである。データベース103は、文書本体データ101のプロパティ情報、例えば文書本体データ101のオーナ情報やアクセス権等を管理するデータベースデータである。セキュリティ情報104は、電子署名等の、文書本体データ101のセキュリティに関するデータである。   FIG. 2 is a diagram showing an example of the document data 100 in the present embodiment. Here, the document data 100 is a general term for the document data 100a held by the document management apparatus 1 and the document data 100b and 100c held by the information processing apparatuses 11a and 11a, respectively. This document data 100 is composed of a plurality of document components 190. Examples of the document component 190 include the document body data 101, the thumbnail 102, the database 103, and the security information 104. The document body data 101 refers to a document file body such as a text file. A thumbnail 102 is thumbnail data of the document body data 101. The database 103 is database data for managing property information of the document body data 101, for example, owner information and access rights of the document body data 101. The security information 104 is data relating to the security of the document body data 101 such as an electronic signature.

文書データ100は、文書構成要素190として、少なくとも文書本体データ101を含む。また文書データ100は、文書本体データ101以外の3つの文書構成要素を含むか否かは任意である。つまり、文書データ100が、文書本体データ101のみから構成されている場合もあり、また文書本体データ101、データベース103、およびセキュリティ情報104という3つの文書構成要素190から構成されている場合もある。尚、データベース103は必ずしも文書本体データ101のプロパティ情報を管理するものに限られず、他の情報を管理するものであってもよい。また、文書データ100は、文書構成要素190として、これ以外のデータを含んでいてもよい。   The document data 100 includes at least document body data 101 as the document component 190. Whether or not the document data 100 includes three document components other than the document body data 101 is arbitrary. That is, the document data 100 may be composed of only the document body data 101, or may be composed of three document components 190, that is, the document body data 101, the database 103, and the security information 104. Note that the database 103 is not necessarily limited to managing the property information of the document main body data 101, but may be other information. Further, the document data 100 may include other data as the document component 190.

図1に戻り、文書管理装置1は、文書データ100aを構成するデータとして、文書構成要素190aを保持している。この文書構成要素190aは、情報処理装置11aにおいて保持される文書データ100bを構成する文書構成要素190bに対応する。また文書構成要素190aは、情報処理装置11bにおいて保持される文書データ100cを構成する文書構成要素190cに対応する。文書管理装置1に保持される文書構成要素190aと、情報処理装置11a,11bに保持される文書構成要素190b,190cとの対応関係は、同種の文書構成要素であるか否かにより判断され、例えばデータの拡張子などで判断される。そして文書データ100aの文書構成要素190aと、文書データ100b,100cの文書構成要素190b,190cとが、同種の文書構成要素であれば、それらは互いに対応した文書構成要素となる。   Returning to FIG. 1, the document management apparatus 1 holds a document component 190a as data constituting the document data 100a. The document constituent element 190a corresponds to the document constituent element 190b constituting the document data 100b held in the information processing apparatus 11a. The document component 190a corresponds to the document component 190c constituting the document data 100c held in the information processing apparatus 11b. The correspondence between the document component 190a held in the document management device 1 and the document components 190b and 190c held in the information processing devices 11a and 11b is determined based on whether or not they are the same type of document component. For example, it is determined by the extension of data. If the document constituent element 190a of the document data 100a and the document constituent elements 190b and 190c of the document data 100b and 100c are the same kind of document constituent elements, they become corresponding document constituent elements.

図1の例では、文書管理装置1が保持する文書データ100aには、文書構成要素190aが含まれている。このとき、情報処理装置11aが保持する文書データ100bには、文書構成要素190aと同種の文書構成要素190b含まれ、情報処理装置11bが保持する文書データ100cには、文書構成要素190aと同種の文書構成要素190cが含まれる。具体的には、文書管理装置1が保持する文書データ100aにサムネイル102が含まれていれば、情報処理装置11aが保持する文書データ100bにも、それに対応するサムネイル102が含まれる。同様に、文書データ100aにデータベース103が含まれれば、情報処理装置11bが保持する文書データ100cにもそれに対応するデータベース103が含まれる。   In the example of FIG. 1, the document data 100a held by the document management apparatus 1 includes a document component 190a. At this time, the document data 100b held by the information processing apparatus 11a includes the same kind of document constituent element 190b as the document constituent element 190a, and the document data 100c held by the information processing apparatus 11b includes the same kind of document constituent element 190a. A document component 190c is included. Specifically, if the document data 100a held by the document management apparatus 1 includes the thumbnail 102, the document data 100b held by the information processing apparatus 11a also includes the corresponding thumbnail 102. Similarly, if the database 103 is included in the document data 100a, the corresponding database 103 is also included in the document data 100c held by the information processing apparatus 11b.

本実施形態の文書管理システムは、文書管理装置1で保持される文書データ100aの内容と、各情報処理装置11で保持される文書データ100b,100cの内容とが同一になるように、文書管理装置1と情報処理装置11との間でネットワーク10を介してデータの送受信を行うように構成されている。ここで、文書データ100aと文書データ100bの内容が同一であるとは、文書データ100aに含まれる文書構成要素190aの内容と、文書データ100bに含まれる文書構成要素190bの内容が、全て同一であることをいう。例えば、文書データ100aが、文書本体データ101aと、サムネイル102aと、データベース103aと、セキュリティ情報104aとから構成されており、文書データ100bが、文書本体データ101bと、サムネイル102bと、データベース103bと、セキュリティ情報104bとから構成されている場合に、文書本体データ101aと101bとが同一内容であり、サムネイル102aと102bとが同一内容であり、データベース103aと103bとが同一内容であり、およびセキュリティ情報104aと104bとが同一内容であるなら、文書データ100aの内容と文書データ100bの内容は同一である。同様に、文書データ100aと文書データ100cの内容が同一であるとは、文書構成要素190aの内容と文書構成要素190cの内容が全て同一であることをいう。   The document management system according to the present embodiment is configured so that the contents of the document data 100a held by the document management apparatus 1 and the contents of the document data 100b and 100c held by each information processing apparatus 11 are the same. Data is transmitted and received between the apparatus 1 and the information processing apparatus 11 via the network 10. Here, the contents of the document data 100a and the document data 100b are the same. The contents of the document component 190a included in the document data 100a and the contents of the document component 190b included in the document data 100b are all the same. Say something. For example, the document data 100a includes document body data 101a, a thumbnail 102a, a database 103a, and security information 104a. The document data 100b includes document body data 101b, a thumbnail 102b, a database 103b, When the security information 104b is configured, the document main body data 101a and 101b have the same contents, the thumbnails 102a and 102b have the same contents, the databases 103a and 103b have the same contents, and the security information If the contents 104a and 104b have the same contents, the contents of the document data 100a and the contents of the document data 100b are the same. Similarly, the contents of the document data 100a and the document data 100c being the same means that the contents of the document constituent element 190a and the contents of the document constituent element 190c are all the same.

また文書管理装置1は、文書データ100aを所定のフォルダ200aに記憶して管理する。そして情報処理装置11aは、文書管理装置1におけるフォルダ200aに対応するフォルダ200bに文書データ100bを記憶して管理する。同様に、情報処理装置11aは、文書管理装置1におけるフォルダ200aに対応するフォルダ200cに文書データ100cを記憶して管理する。ここで、文書管理装置1におけるフォルダ200aと、情報処理装置11におけるフォルダ200b,200cとの対応関係は、それぞれのフォルダの所定のプロパティ、例えばフォルダ名などによって判断される。つまり、文書管理装置1のフォルダ200aのプロパティと、情報処理装置11のフォルダ200b,200cのプロパティとが互いに一致すれば、それらのフォルダは互いに対応するフォルダである。図1の例では、文書管理装置1は、文書データ100aをフォルダ200aに格納している。このとき、情報処理装置11aは、文書データ100bを、フォルダ200aと同一フォルダ名のフォルダ200bに格納し、情報処理装置11bは、文書データ100cを、フォルダ200aと同一フォルダ名のフォルダ200cに格納する。   The document management apparatus 1 stores and manages the document data 100a in a predetermined folder 200a. The information processing apparatus 11a stores and manages the document data 100b in the folder 200b corresponding to the folder 200a in the document management apparatus 1. Similarly, the information processing apparatus 11a stores and manages the document data 100c in a folder 200c corresponding to the folder 200a in the document management apparatus 1. Here, the correspondence between the folder 200a in the document management apparatus 1 and the folders 200b and 200c in the information processing apparatus 11 is determined by a predetermined property of each folder, such as a folder name. That is, if the properties of the folder 200a of the document management apparatus 1 and the properties of the folders 200b and 200c of the information processing apparatus 11 match each other, these folders are corresponding to each other. In the example of FIG. 1, the document management apparatus 1 stores document data 100a in a folder 200a. At this time, the information processing apparatus 11a stores the document data 100b in the folder 200b having the same folder name as the folder 200a, and the information processing apparatus 11b stores the document data 100c in the folder 200c having the same folder name as the folder 200a. .

したがって、本実施形態の文書管理システムでは、文書管理装置1における文書データ100aのデータ保持構造と、情報処理装置11における文書データ100b,100cのデータ保持構造とが同一となっており、文書管理装置1と情報処理装置11とのそれぞれで同一の文書データを共有して保持するようになっている。   Therefore, in the document management system of this embodiment, the data holding structure of the document data 100a in the document management apparatus 1 is the same as the data holding structure of the document data 100b and 100c in the information processing apparatus 11, and the document management apparatus 1 and the information processing apparatus 11 share the same document data.

情報処理装置11(11a、11b・・)は、例えば市販のパーソナルコンピュータ(PC)などで構成される。情報処理装置11aは、文書管理装置1が保持する文書データ100aを、ネットワーク10を介して更新することができる。すなわち、文書管理装置1が保持している文書データ100aの内容を、文書管理装置1に対して文書データ100bを送信することによって、文書管理装置1に書き換えさせることができる。また、情報処理装置11は、自機が保持する文書データ100bの内容を、ネットワーク10を介して文書管理装置1から受信した文書データ100aにより更新することができる。同様に、情報処理装置11bも、文書管理装置1が保持する文書データ100aを自機が保持する文書データ100cによって更新でき、また自機が保持する文書データ100cを、文書管理装置1が保持する100aによって更新できる。   The information processing apparatus 11 (11a, 11b,...) Is configured by, for example, a commercially available personal computer (PC). The information processing apparatus 11 a can update the document data 100 a held by the document management apparatus 1 via the network 10. That is, the content of the document data 100 a held by the document management apparatus 1 can be rewritten by the document management apparatus 1 by transmitting the document data 100 b to the document management apparatus 1. Further, the information processing apparatus 11 can update the content of the document data 100 b held by the information processing apparatus 11 with the document data 100 a received from the document management apparatus 1 via the network 10. Similarly, the information processing apparatus 11b can update the document data 100a held by the document management apparatus 1 with the document data 100c held by the own apparatus, and the document management apparatus 1 holds the document data 100c held by the own apparatus. It can be updated by 100a.

本実施形態の文書管理システムにおいて、情報処理装置11のユーザが文書データ100を利用する際、情報処理装置11が参照する文書データ100は当該情報処理装置11において保持している文書データ100である。すなわち、ユーザは、情報処理装置11で保持される文書データ100を閲覧等することになる。ここで例えば、情報処理装置11aのユーザが文書データ100bに対する編集作業を行って、文書データ100bを更新すると、それに伴い、情報処理装置11は、更新された文書データ100bを文書管理装置1に送信して文書データ100aの内容を、更新された文書データ100bの内容に更新する。すると、情報処理装置11bは、文書管理装置1が保持する文書データ100aとは異なる内容の文書データ100cを保持することになる。この状態で、情報処理装置11bが、そのまま自機で保持する文書データ100cをユーザに表示すれば、ユーザは、文書管理装置1が保持する文書データ100aと異なる内容の文書データ100cを利用することになり、文書の統一が図れない。   In the document management system of this embodiment, when a user of the information processing apparatus 11 uses the document data 100, the document data 100 referred to by the information processing apparatus 11 is the document data 100 held in the information processing apparatus 11. . That is, the user browses the document data 100 held by the information processing apparatus 11. Here, for example, when the user of the information processing apparatus 11a edits the document data 100b and updates the document data 100b, the information processing apparatus 11 transmits the updated document data 100b to the document management apparatus 1 accordingly. Then, the content of the document data 100a is updated to the content of the updated document data 100b. Then, the information processing apparatus 11b holds document data 100c having contents different from the document data 100a held by the document management apparatus 1. In this state, if the information processing apparatus 11b displays the document data 100c held by itself as it is to the user, the user uses the document data 100c having a different content from the document data 100a held by the document management apparatus 1. This makes it difficult to unify documents.

そのため、本実施形態におけるクライアント・サーバ型の文書管理システムでは、各情報処理装置11において保持される文書データ100b,100cが利用される際、文書管理装置1において保持される文書データ100aが更新されて異なるデータとなっているか否かを判断し、その結果、異なるデータに更新されていれば、情報処理装置11が文書管理装置1から更新された文書データ100aをダウンロードし、その文書データ100aにより、各情報処理装置11において保持されている文書データ100b,100cを更新するように構成される。その結果、各情報処理装置11では、この更新された文書データ100b,100cに基づいてユーザに対する表示を行うことができるようになり、システム全体で利用される文書の統一が行える。   Therefore, in the client-server type document management system according to the present embodiment, when the document data 100b and 100c held in each information processing apparatus 11 is used, the document data 100a held in the document management apparatus 1 is updated. If the data is updated to different data as a result, the information processing apparatus 11 downloads the updated document data 100a from the document management apparatus 1, and uses the document data 100a. The document data 100b and 100c held in each information processing apparatus 11 are configured to be updated. As a result, each information processing apparatus 11 can display to the user based on the updated document data 100b and 100c, and can unify documents used in the entire system.

以下、このような文書管理システムについて更に詳しく説明する。尚、文書管理システムに設けられる複数の情報処理装置11のそれぞれは情報処理装置11aと同様の機能および構成であるので、以下においては情報処理装置11として、情報処理装置11aを例に挙げて説明する。   Hereinafter, such a document management system will be described in more detail. Since each of the plurality of information processing apparatuses 11 provided in the document management system has the same function and configuration as the information processing apparatus 11a, the information processing apparatus 11 will be described below as an example of the information processing apparatus 11. To do.

図3は、文書管理装置1のハードウェア構成の一例を示すブロック図である。図3に示すように文書管理装置1は、制御部20と、ネットワークインタフェース23と、記憶装置30とを備え、これらがデータバス24を介して接続されている。制御部20は、CPU21とメモリ22とを備えており、CPU21が、記憶装置30に記憶されているプログラム33を読み出して実行することにより、各部の動作を制御する。メモリ22は、CPU21がプログラム33を実行する際に一時的なデータなどを記憶するためのものである。   FIG. 3 is a block diagram illustrating an example of a hardware configuration of the document management apparatus 1. As shown in FIG. 3, the document management apparatus 1 includes a control unit 20, a network interface 23, and a storage device 30, which are connected via a data bus 24. The control unit 20 includes a CPU 21 and a memory 22. The CPU 21 reads out and executes a program 33 stored in the storage device 30, thereby controlling the operation of each unit. The memory 22 is for storing temporary data and the like when the CPU 21 executes the program 33.

ネットワークインタフェース23は、ネットワーク10を介して情報処理装置11とデータ通信を行うためのものである。   The network interface 23 is for performing data communication with the information processing apparatus 11 via the network 10.

記憶装置30は、例えばハードディスク装置などの不揮発性記憶装置によって構成される。この記憶装置30には、文書管理装置1に予めインストールされたプログラム33が記憶される。また記憶装置30には、文書データ100aを格納する文書データ記憶部31、および文書管理装置1において生成されるハッシュ値および統合ハッシュ値を格納するハッシュ値・統合ハッシュ値記憶部32が設けられる。尚、ハッシュ値および統合ハッシュ値とは、文書データの内容等に対応した一定長のデータのことであるが、これについては後述する。また文書データ記憶部31には、上述したように、情報処理装置11のフォルダ200bと対応するフォルダ200aが文書データ100aを記憶するための記憶領域(記憶部)として設けられる。   The storage device 30 is configured by a nonvolatile storage device such as a hard disk device, for example. The storage device 30 stores a program 33 installed in advance in the document management device 1. Further, the storage device 30 is provided with a document data storage unit 31 for storing the document data 100a, and a hash value / integrated hash value storage unit 32 for storing the hash value and the integrated hash value generated in the document management device 1. The hash value and the integrated hash value are data of a certain length corresponding to the contents of document data and the like, which will be described later. Further, as described above, the folder 200a corresponding to the folder 200b of the information processing apparatus 11 is provided in the document data storage unit 31 as a storage area (storage unit) for storing the document data 100a.

図4は、情報処理装置11aのハードウェア構成の一例を示すブロック図である。図4に示すように情報処理装置11aは、制御部40と、ネットワークインタフェース43と、表示部44と、入力部45と、記憶装置50とを備え、これらがデータバス46を介して接続されている。   FIG. 4 is a block diagram illustrating an example of a hardware configuration of the information processing apparatus 11a. As shown in FIG. 4, the information processing apparatus 11 a includes a control unit 40, a network interface 43, a display unit 44, an input unit 45, and a storage device 50, which are connected via a data bus 46. Yes.

制御部40は、CPU41とメモリ42とを備えており、CPU41が記憶装置50に記憶されているプログラム53および54を読み出して実行することにより、各部の制御や、各種の演算処理を行う。メモリ42はプログラム53および54の実行時に一時的に生成されるデータなどを記憶する。   The control unit 40 includes a CPU 41 and a memory 42. The CPU 41 reads out and executes the programs 53 and 54 stored in the storage device 50, thereby performing control of each unit and various arithmetic processes. The memory 42 stores data temporarily generated when the programs 53 and 54 are executed.

ネットワークインタフェース43は、ネットワーク10を介して文書管理装置1とデータ通信を行うためのものである。   The network interface 43 is for performing data communication with the document management apparatus 1 via the network 10.

表示部44は、文書データに基づいて文書情報を表示したり、その他の情報を表示したりする表示手段であり、例えば液晶ディスプレイなどで構成される。また入力部45は、ユーザが操作することにより各種信号を入力する入力手段であり、例えばキーボードやマウスなどを備えて構成される。   The display unit 44 is a display unit that displays document information based on document data or displays other information, and includes a liquid crystal display, for example. The input unit 45 is an input unit that inputs various signals when operated by a user, and includes, for example, a keyboard and a mouse.

記憶装置50は、例えばハードディスク装置などの不揮発性記憶装置によって構成される。この記憶装置50には、情報処理装置11に予めインストールされたプログラム53および54が記憶される。システムプログラム53は、オペレーティングシステムである。また、アプリケーションプログラム54は、自機が保持する文書データ100bを閲覧したり、また文書管理装置1が保持する文書データ100aを更新したり、等するためのプログラムである。また記憶装置50には、文書データ100bを格納する文書データ記憶部51、および文書管理装置1から受信するハッシュ値および統合ハッシュ値を格納するハッシュ値・統合ハッシュ値記憶部52が設けられる。ここで、文書データ記憶部51には、上述したように、文書管理装置1のフォルダ200aと対応するフォルダ200bが文書データ100bを記憶するための記憶領域として設けられる。   The storage device 50 is configured by a nonvolatile storage device such as a hard disk device, for example. The storage device 50 stores programs 53 and 54 installed in advance in the information processing apparatus 11. The system program 53 is an operating system. The application program 54 is a program for browsing the document data 100b held by the device itself, updating the document data 100a held by the document management apparatus 1, and the like. The storage device 50 includes a document data storage unit 51 that stores the document data 100b, and a hash value / integrated hash value storage unit 52 that stores hash values and integrated hash values received from the document management device 1. Here, in the document data storage unit 51, as described above, the folder 200b corresponding to the folder 200a of the document management apparatus 1 is provided as a storage area for storing the document data 100b.

上述したように、情報処理装置11aは、自機で保持する文書データ100bにより、文書管理装置1で保持される文書データ100aを更新することができる。同様に、他の情報処理装置11bも、文書管理装置1で保持される文書データ100aを更新することがある。他の情報処理装置11bが文書管理装置1で保持される文書データ100aを更新した場合、情報処理装置11aで保持する文書データ100bは文書管理装置1の文書データ100aと異なった内容のデータとなる。そこで、情報処理装置11aは、自機が保持する文書データ100bを文書管理装置1が保持する文書データ100aで更新することによって、文書データ100bが文書データ100aと同一の内容となるようにしている。本実施形態では、情報処理装置11aが文書管理装置1からダウンロードして文書データ100bを更新する処理は、例えばユーザが情報処理装置11aに対して文書データ100bを閲覧等するなどの指示を行った際に行われるようになっている。   As described above, the information processing apparatus 11a can update the document data 100a held by the document management apparatus 1 with the document data 100b held by the information processing apparatus 11a. Similarly, the other information processing apparatus 11b may update the document data 100a held in the document management apparatus 1. When the other information processing apparatus 11b updates the document data 100a held by the document management apparatus 1, the document data 100b held by the information processing apparatus 11a has different data from the document data 100a of the document management apparatus 1. . Therefore, the information processing apparatus 11a updates the document data 100b held by the own apparatus with the document data 100a held by the document management apparatus 1 so that the document data 100b has the same content as the document data 100a. . In the present embodiment, in the process in which the information processing apparatus 11a is downloaded from the document management apparatus 1 and the document data 100b is updated, for example, the user instructs the information processing apparatus 11a to browse the document data 100b. When it comes to being.

このとき、本実施形態では、文書管理装置1で保持される文書データ100aに含まれる文書構成要素190aのうち、情報処理装置11aで閲覧対象等として選択された文書データ100bに含まれる文書構成要素190bと内容が異なるものが存在するか否かを判別し、内容の異なるものが存在すればその文書構成要素190aを特定する。このような判別処理は、情報処理装置11aにおいて行っても良いし、また文書管理装置1で行っても良い。そして文書構成要素190bと内容の異なる文書構成要素190aが特定されると、文書管理装置1が、情報処理装置11aに対して、その特定された文書構成要素190aのみを送信する。これにより、情報処理装置11aが保持する文書データ100bの更新を行うことができる。本実施形態では、このような判別処理を情報処理装置11aで行う場合を例示する。情報処理装置11aにおいて判別処理を行うことで、例えば文書管理装置1とネットワーク10を介して接続されている情報処理装置11の台数が多い場合でも、文書管理装置1の処理パフォーマンスへの負担が大きく軽減することができる。   At this time, in the present embodiment, among the document constituent elements 190a included in the document data 100a held by the document management apparatus 1, the document constituent elements included in the document data 100b selected as a browsing target or the like by the information processing apparatus 11a. It is determined whether or not there is something different in content from 190b. If there is something different in content, the document component 190a is specified. Such determination processing may be performed in the information processing apparatus 11a or may be performed in the document management apparatus 1. When a document component 190a having a content different from that of the document component 190b is specified, the document management apparatus 1 transmits only the specified document component 190a to the information processing apparatus 11a. Thereby, the document data 100b held by the information processing apparatus 11a can be updated. In this embodiment, the case where such a determination process is performed by the information processing apparatus 11a is illustrated. By performing the discrimination process in the information processing apparatus 11a, for example, even when the number of information processing apparatuses 11 connected to the document management apparatus 1 via the network 10 is large, the burden on the processing performance of the document management apparatus 1 is large. Can be reduced.

情報処理装置11aが判別処理を行う際、文書管理装置1で生成されるハッシュ値(ダイジェストデータ)を参照して判別を行う。以下、詳しく説明する。本実施形態においては、文書構成要素190aまたは文書構成要素190bの内容に対応したデータであるハッシュ値(ダイジェストデータ)と、文書データ100aまたは文書データ100bの内容に対応したデータである文書ハッシュ値(文書ダイジェストデータ)と、フォルダ200aまたはフォルダ200bの内容に対応したデータであるフォルダハッシュ値(合成ダイジェストデータ)、の3種類のハッシュ値を用いて、文書構成要素190bと異なる内容の文書構成要素190aが存在するか否かを判別する。尚、フォルダハッシュ値が対応するフォルダの内容については、後述する。   When the information processing apparatus 11a performs the determination process, the determination is performed with reference to the hash value (digest data) generated by the document management apparatus 1. This will be described in detail below. In the present embodiment, a hash value (digest data) that is data corresponding to the contents of the document component 190a or the document component 190b and a document hash value (data corresponding to the contents of the document data 100a or the document data 100b) ( Document constituent element 190a having a different content from document constituent element 190b using three types of hash values: document digest data) and folder hash value (synthetic digest data) corresponding to the contents of folder 200a or folder 200b. It is determined whether or not exists. The contents of the folder corresponding to the folder hash value will be described later.

まず文書管理装置1において行われる処理について説明する。文書管理装置1は、複数の文書構成要素190aのそれぞれから、各文書構成要素190aの内容に対応したハッシュ値を生成する。次に文書データ100aの内容に対応した文書ハッシュ値と、フォルダ200aの内容に対応したフォルダハッシュ値とを生成する。文書管理装置1では、これら各種ハッシュ値を文書データ100aのデータ保持構造に対応付けて記憶しておく。そして、情報処理装置11aから、文書構成要素190aの送信要求があった場合、文書管理装置1は、文書構成要素190aと共に、それらハッシュ値を情報処理装置11aに送信する。これにより情報処理装置11aでは、文書データ100bのデータ保持構造に対応したハッシュ値が保持されることになる。   First, processing performed in the document management apparatus 1 will be described. The document management apparatus 1 generates a hash value corresponding to the contents of each document component 190a from each of the plurality of document components 190a. Next, a document hash value corresponding to the contents of the document data 100a and a folder hash value corresponding to the contents of the folder 200a are generated. In the document management apparatus 1, these various hash values are stored in association with the data holding structure of the document data 100a. Then, when there is a transmission request for the document component 190a from the information processing device 11a, the document management device 1 transmits these hash values together with the document component 190a to the information processing device 11a. As a result, the information processing apparatus 11a holds a hash value corresponding to the data holding structure of the document data 100b.

文書管理装置1で保持される文書データ100a又はその文書構成要素190aと、情報処理装置11aで保持される文書データ100b又はその文書構成要素190bとが同一の内容であれば、文書管理装置1で保持される各種ハッシュ値と、情報処理装置11aで保持される各種ハッシュ値とが一致した値となる。これに対し、文書管理装置1で保持される文書データ100a又はその文書構成要素190aと、情報処理装置11aで保持される文書データ100b又はその文書構成要素190bとが互いに異なる内容となっていれば、文書管理装置1で保持される各種ハッシュ値と、情報処理装置11aで保持される各種ハッシュ値とが異なる値となる。   If the document data 100a or its document component 190a held in the document management device 1 and the document data 100b or its document component 190b held in the information processing device 11a have the same contents, the document management device 1 The various hash values held and the various hash values held by the information processing apparatus 11a coincide with each other. On the other hand, if the document data 100a or its document component 190a held in the document management apparatus 1 and the document data 100b or its document component 190b held in the information processing apparatus 11a have different contents from each other. The various hash values held in the document management apparatus 1 are different from the various hash values held in the information processing apparatus 11a.

そのため、本実施形態では、情報処理装置11aが上記判別処理を行う際、文書管理装置1においてその時点で保持されている各種ハッシュ値を取得し、情報処理装置11aで保持しているハッシュ値との比較を行う。具体的には、文書ハッシュ値およびフォルダハッシュ値を比較することにより、文書データ100aと文書データ100bの内容が異なっているか否かを判別し、その後、文書構成要素ごとのハッシュ値を用いて文書構成要素190bと内容の異なる文書構成要素190aを特定する。これにより、例えば文書データ100aと文書データ100bの内容が同一である場合に、これらの文書データの文書ハッシュ値を比較すれば、文書構成要素190aと文書構成要素190bとを個別に比較することなしに、文書構成要素190aと文書構成要素190bとは全て同一データ内容の文書構成要素で構成されていることが判明する。また、フォルダ200aのフォルダハッシュ値とフォルダ200bのフォルダハッシュ値とを比較すれば、それぞれのフォルダ200a,200bに複数の文書データが記憶されている場合であっても、それらを個別に比較することなしに全ての文書データが同一内容であることが判明する。この場合、各文書データに含まれる複数の文書構成要素190のそれぞれについて個別に比較することなく、文書構成要素190aと文書構成要素190bとが全て同一内容であることが明らかになる。   Therefore, in the present embodiment, when the information processing apparatus 11a performs the determination process, the document management apparatus 1 acquires various hash values held at that time, and the hash value held in the information processing apparatus 11a Make a comparison. Specifically, it is determined whether or not the contents of the document data 100a and the document data 100b are different by comparing the document hash value and the folder hash value. A document component 190a having a content different from that of the component 190b is specified. Accordingly, for example, when the contents of the document data 100a and the document data 100b are the same, if the document hash values of these document data are compared, the document constituent element 190a and the document constituent element 190b are not individually compared. In addition, it is found that the document component 190a and the document component 190b are all composed of document components having the same data contents. Further, if the folder hash value of the folder 200a and the folder hash value of the folder 200b are compared, even if a plurality of document data is stored in each of the folders 200a and 200b, they are individually compared. It turns out that all the document data has the same content without. In this case, it becomes clear that the document component 190a and the document component 190b all have the same content without individually comparing each of the plurality of document components 190 included in each document data.

このように本実施形態では、文書管理装置1で保持される複数の文書構成要素190aのうち、情報処理装置11aで保持される文書構成要素190bと内容が異なるものが存在するかを判別する際、フォルダハッシュ値、文書ハッシュ値およびハッシュ値の順でハッシュ値比較を行っていく。このような判別手法を用いれば、異なる内容の文書構成要素を全て特定するために必要なデータの比較回数を抑えることができ、文書管理システムのパフォーマンスの低下を回避することができるようになる。   As described above, in the present exemplary embodiment, when determining whether there is a document component 190a held in the document management apparatus 1 that has a content different from that of the document component 190b held in the information processing apparatus 11a. The hash value comparison is performed in the order of the folder hash value, the document hash value, and the hash value. By using such a discriminating method, it is possible to suppress the number of comparisons of data necessary to specify all document components having different contents, and to avoid a decrease in the performance of the document management system.

ここで、本実施形態においては、文書ハッシュ値およびフォルダハッシュ値を総称して統合ハッシュ値という。従って、上述した判別手法では、まず統合ハッシュ値を用いて、フォルダ200aの内容とフォルダ200bの内容が異なるか否かを判別し、異なる場合は次に文書データ100aの内容と文書データ100bの内容が異なるか否かを判別する。そしてさらに異なる場合には、その後、ハッシュ値を用いて文書構成要素190bと内容が異なる文書構成要素190aを特定することになる。   Here, in the present embodiment, the document hash value and the folder hash value are collectively referred to as an integrated hash value. Therefore, in the above-described determination method, first, using the integrated hash value, it is determined whether or not the contents of the folder 200a and the contents of the folder 200b are different. If they are different, then the contents of the document data 100a and the contents of the document data 100b are determined. It is determined whether or not. If the document component 190a is different, the hash value is used to specify a document component 190a having a different content from the document component 190b.

このような本実施形態の文書管理システムにおいて、ユーザが情報処理装置11aを用いて文書データ100bを利用しようとした場合、まず、データ判別を行わせるために、情報処理装置11aに対して文書管理装置1が生成したハッシュ値および統合ハッシュ値を送信する。そして情報処理装置11aが、文書管理装置1から受信したハッシュ値および統合ハッシュ値を用いてデータ判別を行った後、文書構成要素190bと内容が異なる文書構成要素190aが存在すれば、その文書構成要素190aの送信を文書管理装置1に対して要求する。これにより、文書管理装置1は要求のあった文書構成要素190aのみを情報処理装置11aに送信する。そして情報処理装置11bは、自機で保持している文書構成要素190bを、文書管理装置1から受信した文書構成要素190aにより更新する。このような一連の処理を行うことで、文書データ100aと、文書データ100bとが同一のデータ内容として構成される。つまり、文書管理装置1と情報処理装置11aとでデータの同一性が保持される。   In such a document management system of the present embodiment, when a user tries to use the document data 100b using the information processing apparatus 11a, first, the document management is performed on the information processing apparatus 11a in order to perform data discrimination. The hash value and the integrated hash value generated by the device 1 are transmitted. Then, after the information processing apparatus 11a performs data discrimination using the hash value and the integrated hash value received from the document management apparatus 1, if there is a document constituent element 190a whose contents are different from the document constituent element 190b, the document configuration The document management apparatus 1 is requested to transmit the element 190a. As a result, the document management apparatus 1 transmits only the requested document component 190a to the information processing apparatus 11a. Then, the information processing apparatus 11b updates the document component 190b held by the information processing apparatus 11b with the document component 190a received from the document management apparatus 1. By performing such a series of processing, the document data 100a and the document data 100b are configured as the same data content. That is, the sameness of data is maintained between the document management apparatus 1 and the information processing apparatus 11a.

そして本実施形態では、上述の判別処理をハッシュ値および統合ハッシュ値を用いて行うので、従来の方法に比べデータ処理の負担が軽減されることとなり、文書管理システム全体のパフォーマンスの低下を回避できる。尚、上述した例では、主として情報処理装置11aと文書管理装置1との関係について説明したが、他の情報処理装置11bについても同様である。   In this embodiment, since the above-described determination process is performed using a hash value and an integrated hash value, the data processing burden is reduced as compared with the conventional method, and a decrease in the performance of the entire document management system can be avoided. . In the example described above, the relationship between the information processing apparatus 11a and the document management apparatus 1 has been mainly described, but the same applies to the other information processing apparatus 11b.

次に上記のような動作を実現するための、文書管理装置1における具体的な内部機能について説明する。図5は、文書管理装置1の制御部20がプログラム33を実行することによって実現される詳細な機能構成を示すブロック図である。尚、図5では、文書管理装置1が保持する文書データ100aの更新後、新たに更新後の文書データ100aについてハッシュ値・統合ハッシュ値を生成する機能、および、ユーザが情報処理装置11aを操作して文書データ100bを閲覧等しようとした場合に、文書データ100aと文書データ100bとを同一内容にするため、文書管理装置1が情報処理装置11aに文書構成要素190aを送信する機能に関するブロックのみを示しており、それ以外の機能については図示を省略している。   Next, specific internal functions in the document management apparatus 1 for realizing the operation as described above will be described. FIG. 5 is a block diagram showing a detailed functional configuration realized by the control unit 20 of the document management apparatus 1 executing the program 33. In FIG. 5, after updating the document data 100a held by the document management apparatus 1, a function for generating a hash value / integrated hash value for the newly updated document data 100a, and a user operating the information processing apparatus 11a When the document data 100b is to be browsed, only the block relating to the function of the document management apparatus 1 transmitting the document component 190a to the information processing apparatus 11a is used to make the document data 100a and the document data 100b have the same contents. The other functions are not shown.

図5に示すように、制御部20は、プログラム33を実行することにより、文書データ更新部60、ハッシュ値生成部61、統合ハッシュ値生成部62、文書ハッシュ値生成部63、フォルダハッシュ値生成部64、ハッシュ値・統合ハッシュ値送信部65、文書構成要素送信部66として機能する。   As shown in FIG. 5, the control unit 20 executes a program 33 to thereby generate a document data update unit 60, a hash value generation unit 61, an integrated hash value generation unit 62, a document hash value generation unit 63, and a folder hash value generation. Functions as a unit 64, a hash value / integrated hash value transmission unit 65, and a document component transmission unit 66.

文書データ更新部60は、文書管理装置1が保持する文書データ100aの更新を行う。具体的には、情報処理装置11aから文書構成要素190bが送信されてきた場合に、文書データ記憶部31に格納されている文書構成要素190aを、当該送信されてきた文書構成要素190bに書き換える。これにより、文書構成要素190aの内容は、送信されてきた文書構成要素190bの内容と同一になる。   The document data update unit 60 updates the document data 100 a held by the document management apparatus 1. Specifically, when the document component 190b is transmitted from the information processing apparatus 11a, the document component 190a stored in the document data storage unit 31 is rewritten to the transmitted document component 190b. As a result, the content of the document component 190a becomes the same as the content of the transmitted document component 190b.

ハッシュ値生成部61は、文書データ更新部60により文書データ100aが更新された場合に機能し、文書データ更新部60により書き換えられた文書構成要素190aから、ハッシュ値を生成する。具体的には、文書データ更新部60により書き換えられた文書構成要素190aを、記憶装置30に格納されている所定のハッシュ関数に入力し、文書構成要素190aの内容に対応した一定長のデータであるハッシュ値の出力を得る。つまり、ハッシュ値生成部61は、文書データ更新部60により書き換えられた文書構成要素190aの、書き換え後の内容に対応するハッシュ値を生成する。ここで、ハッシュ関数とは、入力したデータの内容に対応した、一定長のデータを出力する関数のことをいう。ハッシュ関数は、入力されるデータの内容が異なる場合は、異なるデータをハッシュ値として出力する。従って、ハッシュ関数の出力であるハッシュ値を比較すれば、文書構成要素190bと内容が異なる文書構成要素190aを特定できる。そしてハッシュ値生成部61は、上述のようにして生成したハッシュ値により、ハッシュ値・統合ハッシュ値記憶部32に設けられたハッシュ値記憶部34に記憶されているハッシュ値を更新する。具体的には、ハッシュ値記憶部34に記憶されている、文書データ更新部60による書き換え前の文書構成要素190aのハッシュ値を、上述のようにして新たに生成した書き換え後の文書構成要素190aのハッシュ値に書き換える。   The hash value generation unit 61 functions when the document data 100a is updated by the document data update unit 60, and generates a hash value from the document component 190a rewritten by the document data update unit 60. Specifically, the document component 190a rewritten by the document data update unit 60 is input to a predetermined hash function stored in the storage device 30, and data having a certain length corresponding to the content of the document component 190a is input. Get the output of some hash value. That is, the hash value generation unit 61 generates a hash value corresponding to the rewritten content of the document component 190 a rewritten by the document data update unit 60. Here, the hash function refers to a function that outputs data of a certain length corresponding to the content of input data. The hash function outputs different data as a hash value when the contents of input data are different. Therefore, by comparing the hash values that are the outputs of the hash functions, it is possible to specify a document component 190a having a different content from the document component 190b. The hash value generation unit 61 updates the hash value stored in the hash value storage unit 34 provided in the hash value / integrated hash value storage unit 32 with the hash value generated as described above. Specifically, the hash value of the document component 190a before rewriting by the document data updating unit 60 stored in the hash value storage unit 34 is newly generated as described above, and the document component 190a after rewriting is newly generated. Rewrite to the hash value of.

図6(a)は、文書データ更新部60により更新された文書データ110aの文書ハッシュ値生成概念図である。ここで、文書データ110aは、文書データ100aの一例である。すなわち、文書管理装置1が文書データ110aを保持し、文書データ110aと同一のプロパティを有する文書データ110bを、情報処理装置11aが保持していると仮定する。尚、図6では、文書構成要素190aは文書本体データ111a、サムネイル112a、データベース113a、およびセキュリティ情報114aの4つであり、これらは全て文書データ更新部60により書き換えられているものとする。この場合、ハッシュ値生成部61は、文書本体データ111aをハッシュ関数80に入力し、その文書本体データ111aの内容に対応したハッシュ値311aを得る。またサムネイル112aをハッシュ関数80に入力し、そのサムネイル112aの内容に対応したハッシュ値312aを得る。またデータベース113aをハッシュ関数80に入力し、そのデータベース113aの内容に対応したハッシュ値313aを得る。またセキュリティ情報114aをハッシュ関数80に入力し、そのセキュリティ情報114aの内容に対応したハッシュ値314aを得る。以上のようにしてハッシュ値生成部61は、文書データ更新部60により更新された文書データ110aに含まれる各文書構成要素190aのハッシュ値を生成する。   FIG. 6A is a conceptual diagram of document hash value generation of the document data 110 a updated by the document data update unit 60. Here, the document data 110a is an example of the document data 100a. That is, it is assumed that the document management apparatus 1 holds the document data 110a, and the information processing apparatus 11a holds the document data 110b having the same property as the document data 110a. In FIG. 6, there are four document components 190a, ie, document body data 111a, thumbnail 112a, database 113a, and security information 114a, all of which have been rewritten by the document data update unit 60. In this case, the hash value generation unit 61 inputs the document body data 111a to the hash function 80, and obtains a hash value 311a corresponding to the contents of the document body data 111a. The thumbnail 112a is input to the hash function 80, and a hash value 312a corresponding to the contents of the thumbnail 112a is obtained. Further, the database 113a is input to the hash function 80, and a hash value 313a corresponding to the contents of the database 113a is obtained. Also, the security information 114a is input to the hash function 80, and a hash value 314a corresponding to the contents of the security information 114a is obtained. As described above, the hash value generation unit 61 generates a hash value of each document component 190a included in the document data 110a updated by the document data update unit 60.

統合ハッシュ値生成部62は、文書ハッシュ値生成部63とフォルダハッシュ値生成部64とを備えている。文書ハッシュ値生成部63は文書ハッシュ値を生成し、フォルダハッシュ値生成部64はフォルダハッシュ値を生成する。ハッシュ値生成部61により新たにハッシュ値が生成された場合に文書ハッシュ値生成部63が機能し、文書ハッシュ値生成部63による文書ハッシュ値の生成が終わった後、フォルダハッシュ値生成部64が機能する。   The integrated hash value generation unit 62 includes a document hash value generation unit 63 and a folder hash value generation unit 64. The document hash value generation unit 63 generates a document hash value, and the folder hash value generation unit 64 generates a folder hash value. When a new hash value is generated by the hash value generation unit 61, the document hash value generation unit 63 functions. After the generation of the document hash value by the document hash value generation unit 63 is finished, the folder hash value generation unit 64 Function.

文書ハッシュ値生成部63は、文書データ更新部60により更新された文書データ100aにつき、文書データ100aを構成する複数の文書構成要素190aのそれぞれに基づいて文書データ100aの内容に対応した文書ハッシュ値を生成する。具体的には、文書データ100aを構成する複数の文書構成要素190aのそれぞれの内容に対応した複数のハッシュ値を、ハッシュ関数に入力し、当該文書データ100aの内容に対応した一定長のデータである文書ハッシュ値の出力を得る。このとき、文書データ更新部60により書き換えられた文書構成要素190aについては、ハッシュ値生成部61において生成されたハッシュ値を用い、文書データ更新部60により書き換えられていない文書構成要素190aについては、ハッシュ値記憶部34から読み込んだハッシュ値を用いることになる。つまり、文書ハッシュ値生成部63は、文書データ更新部60により更新された文書データ100aの、更新後の内容に対応した文書ハッシュ値を生成する。このような文書ハッシュ値は、ハッシュ値と同様、ハッシュ関数に入力される複数のハッシュ値のうちの少なくとも1つが異なる値であれば、異なる値のハッシュ値として出力される。そのため、文書ハッシュ値を比較すれば、文書データ100aを構成する複数の文書構成要素190aのそれぞれの内容と、文書データ100bを構成する複数の文書構成要素190bのそれぞれの内容とが異なるか否かを判別できる。   The document hash value generation unit 63, for the document data 100a updated by the document data update unit 60, a document hash value corresponding to the content of the document data 100a based on each of the plurality of document components 190a constituting the document data 100a. Is generated. Specifically, a plurality of hash values corresponding to the contents of the plurality of document constituent elements 190a constituting the document data 100a are input to a hash function, and the data has a fixed length corresponding to the contents of the document data 100a. Get the output of a document hash value. At this time, for the document component 190a rewritten by the document data update unit 60, the hash value generated by the hash value generation unit 61 is used, and the document component 190a that has not been rewritten by the document data update unit 60 is: The hash value read from the hash value storage unit 34 is used. That is, the document hash value generation unit 63 generates a document hash value corresponding to the updated content of the document data 100a updated by the document data update unit 60. Similar to the hash value, such a document hash value is output as a hash value having a different value if at least one of the plurality of hash values input to the hash function is different. Therefore, if the document hash values are compared, whether or not the contents of the plurality of document components 190a constituting the document data 100a are different from the contents of the plurality of document components 190b constituting the document data 100b. Can be determined.

図6(b)は、文書データ110aの文書ハッシュ値生成概念図である。文書ハッシュ値生成部63は、図6(a)においてハッシュ値生成部61が文書本体データ111aから生成したハッシュ値311aと、ハッシュ値生成部61がサムネイル112aから生成したハッシュ値312aと、ハッシュ値生成部61がデータベース113aから生成したハッシュ値313aと、およびハッシュ値生成部61がセキュリティ情報114aから生成したハッシュ値314aとをハッシュ関数80に入力し、文書データ110aの内容に対応した文書ハッシュ値410aを得る。   FIG. 6B is a conceptual diagram of document hash value generation of the document data 110a. In FIG. 6A, the document hash value generation unit 63 includes a hash value 311a generated from the document body data 111a by the hash value generation unit 61, a hash value 312a generated from the thumbnail 112a by the hash value generation unit 61, and a hash value. The hash value 313a generated by the generation unit 61 from the database 113a and the hash value 314a generated by the hash value generation unit 61 from the security information 114a are input to the hash function 80, and the document hash value corresponding to the content of the document data 110a 410a is obtained.

上述のようにして文書ハッシュ値生成部63が文書ハッシュ値を生成した後、フォルダハッシュ値生成部64は、文書データ更新部60により更新された文書データ100aを格納しているフォルダ200aについて、フォルダハッシュ値を生成する。具体的には、フォルダ200aが下位フォルダを持つか否かにより、以下の2つの生成方法が実行される。   After the document hash value generation unit 63 generates the document hash value as described above, the folder hash value generation unit 64 uses the folder 200a in which the document data 100a updated by the document data update unit 60 is stored. Generate a hash value. Specifically, the following two generation methods are executed depending on whether or not the folder 200a has a lower folder.

(1)下位フォルダを持たないフォルダ200aについては、当該フォルダに格納されている全ての文書データ100aの内容に対応した複数の文書ハッシュ値から、その複数の文書ハッシュ値に対応したフォルダハッシュ値を生成する。具体的には、当該フォルダに格納されている複数の文書データ100aのそれぞれの内容に対応した複数の文書ハッシュ値を、記憶装置30に格納されているハッシュ関数に入力し、その複数の文書ハッシュ値に対応した一定長のデータであるフォルダハッシュ値の出力を得る。このとき、文書データ更新部60により更新された文書データ100aについては、文書ハッシュ値生成部63において生成された文書ハッシュ値を用い、文書データ更新部60により更新されていない文書データ100aについては、統合ハッシュ値記憶部35から読み込んだ文書ハッシュ値を用いることになる。   (1) For a folder 200a having no lower folder, a folder hash value corresponding to the plurality of document hash values is obtained from a plurality of document hash values corresponding to the contents of all the document data 100a stored in the folder. Generate. Specifically, a plurality of document hash values corresponding to the contents of the plurality of document data 100a stored in the folder are input to a hash function stored in the storage device 30, and the plurality of document hashes are input. An output of a folder hash value that is data of a certain length corresponding to the value is obtained. At this time, for the document data 100a updated by the document data update unit 60, the document hash value generated by the document hash value generation unit 63 is used, and for the document data 100a not updated by the document data update unit 60, The document hash value read from the integrated hash value storage unit 35 is used.

図7(a)は、下位フォルダを持たないフォルダ210aのフォルダハッシュ値生成概念図である。ここで、フォルダ210aはフォルダ200aの一例である。すなわち、文書管理装置1がフォルダ210aを有し、フォルダ210aと同一のプロパティを有するフォルダ210bを、情報処理装置11aが有していると仮定する。尚、図7では全ての文書データ100aが文書データ更新部60により更新されたものとする。フォルダ210aには、文書データ100aの一例である文書データ110a、文書データ120a、および文書データ130aが格納されている。文書データ110aの文書ハッシュ値410a、文書データ120aの文書ハッシュ値420a、および文書データ130aの文書ハッシュ値430aを、上述した文書ハッシュ値生成方法により文書ハッシュ値生成部63が生成した後、フォルダハッシュ値生成部64は、文書ハッシュ値420と、文書ハッシュ値420と、文書ハッシュ値440とをハッシュ関数80に入力して、文書ハッシュ値420の内容、文書ハッシュ値430の内容、および文書ハッシュ値440の内容に対応した、フォルダ210aのフォルダハッシュ値510aを得る。   FIG. 7A is a conceptual diagram of folder hash value generation for the folder 210a having no lower folder. Here, the folder 210a is an example of the folder 200a. That is, it is assumed that the document management apparatus 1 has a folder 210a, and the information processing apparatus 11a has a folder 210b having the same properties as the folder 210a. In FIG. 7, it is assumed that all document data 100 a has been updated by the document data update unit 60. The folder 210a stores document data 110a, document data 120a, and document data 130a, which are examples of the document data 100a. After the document hash value generation unit 63 generates the document hash value 410a of the document data 110a, the document hash value 420a of the document data 120a, and the document hash value 430a of the document data 130a by the above-described document hash value generation method, the folder hash The value generation unit 64 inputs the document hash value 420, the document hash value 420, and the document hash value 440 to the hash function 80, and the contents of the document hash value 420, the contents of the document hash value 430, and the document hash value A folder hash value 510a of the folder 210a corresponding to the contents of 440 is obtained.

(2)下位フォルダを持つフォルダ200aについては、当該フォルダ200aに格納されている全ての文書データ100aの内容に対応した複数の文書ハッシュ値と、1つ下位のフォルダのフォルダハッシュ値とから、その複数の文書ハッシュ値および1つ下位のフォルダのフォルダハッシュ値に対応したフォルダハッシュ値を生成する。具体的には、フォルダ200aに格納されている各文書データ100aの内容に対応した複数の文書ハッシュ値と、1つ下位のフォルダのハッシュ値とを、記憶装置30に格納されているハッシュ関数に入力し、その複数の文書ハッシュ値および1つ下位のフォルダのフォルダハッシュ値に対応した一定長のデータであるフォルダハッシュ値の出力を得る。このとき、文書データ更新部60により更新された文書データ100aについては、文書ハッシュ値生成部63において生成された文書ハッシュ値を用い、文書データ更新部60により更新されていない文書データ100aについては、統合ハッシュ値記憶部35から読み込んだ文書ハッシュ値を用いることになる。また、1つ下位のフォルダが文書データ更新部60により更新された文書データを格納している場合はフォルダハッシュ値生成部64によって生成されたフォルダハッシュ値を用いる。さらに、1つ下位のフォルダが文書データ更新部60により更新されていない文書データのみを格納する場合は、統合ハッシュ値記憶部35から読み込んだフォルダハッシュ値を用いる。   (2) For a folder 200a having a lower folder, from a plurality of document hash values corresponding to the contents of all the document data 100a stored in the folder 200a and a folder hash value of a lower folder, A folder hash value corresponding to a plurality of document hash values and a folder hash value of a folder one level lower is generated. Specifically, a plurality of document hash values corresponding to the contents of each document data 100a stored in the folder 200a and a hash value of a folder one lower level are converted into a hash function stored in the storage device 30. Then, an output of a folder hash value which is data of a fixed length corresponding to the plurality of document hash values and the folder hash value of the folder one level lower is obtained. At this time, for the document data 100a updated by the document data update unit 60, the document hash value generated by the document hash value generation unit 63 is used, and for the document data 100a not updated by the document data update unit 60, The document hash value read from the integrated hash value storage unit 35 is used. Further, when the lower-order folder stores the document data updated by the document data update unit 60, the folder hash value generated by the folder hash value generation unit 64 is used. Furthermore, when only the document data that has not been updated by the document data update unit 60 is stored in the next lower folder, the folder hash value read from the integrated hash value storage unit 35 is used.

図7(b)は、下位フォルダが存在するフォルダ220aのフォルダハッシュ値生成の概念図である。ここで、フォルダ220aはフォルダ200aの一例である。フォルダ220aには、文書データ100aの一例である文書データ140aおよび文書データ150aが格納されており、その1つ下位のフォルダとしてフォルダ210aが存在する。文書データ140aの文書ハッシュ値440aおよび文書データ150aの文書ハッシュ値450aを、上述した文書ハッシュ値生成方法により文書ハッシュ値生成部63が生成した後、フォルダハッシュ値生成部64は、フォルダ210aのフォルダハッシュ値510aを、上述した下位フォルダが存在しない場合のフォルダハッシュ値生成方法により生成する。そしてフォルダハッシュ値生成部64は、文書ハッシュ値440aと、文書ハッシュ値450aと、フォルダハッシュ値510aとをハッシュ関数80に入力して、文書ハッシュ値440aの内容、文書ハッシュ値450aの内容、およびフォルダハッシュ値510aの内容に対応した、フォルダ220aのフォルダハッシュ値520aを得る。   FIG. 7B is a conceptual diagram of folder hash value generation for the folder 220a in which the lower folder exists. Here, the folder 220a is an example of the folder 200a. The folder 220a stores document data 140a and document data 150a, which are examples of the document data 100a, and a folder 210a exists as a lower folder. After the document hash value generation unit 63 generates the document hash value 440a of the document data 140a and the document hash value 450a of the document data 150a by the above-described document hash value generation method, the folder hash value generation unit 64 stores the folder hash value of the folder 210a. The hash value 510a is generated by the folder hash value generation method when the above-described lower folder does not exist. Then, the folder hash value generation unit 64 inputs the document hash value 440a, the document hash value 450a, and the folder hash value 510a to the hash function 80, and the contents of the document hash value 440a, the contents of the document hash value 450a, and A folder hash value 520a of the folder 220a corresponding to the contents of the folder hash value 510a is obtained.

つまり、フォルダハッシュ値生成部64は、文書データ更新部60により文書データ100aが更新された場合、その更新後の文書データ100aを格納しているフォルダおよびその上位フォルダの全てについて、それらフォルダに格納されている全ての文書データ100aの文書ハッシュ値の内容と、1つ下位のフォルダのフォルダハッシュ値の内容とに対応したハッシュ値を生成する。ここで、下位のフォルダが存在しない場合のフォルダハッシュ値は、そのフォルダに格納されている全ての文書データ100aの文書ハッシュ値の内容に対応している。また、下位のフォルダが存在する場合のフォルダハッシュ値は、そのフォルダに格納されている全ての文書データ100aの内容と、そのフォルダよりも下位のフォルダ全てに格納されている全ての文書データ100aの内容に対応している。従って、フォルダハッシュ値を比較すれば、そのフォルダ、およびそのフォルダより下位のフォルダに格納されている文書データ100aのうちで、文書データ100bと内容が異なるものが存在するか否かを判定することができる。このようにフォルダハッシュ値は、そのフォルダに格納されている全ての文書データ100aおよびその文書データ100aを構成する全ての文書構成要素190aの内容を反映したダイジェストデータとなっている。   That is, when the document data 100a is updated by the document data update unit 60, the folder hash value generation unit 64 stores all of the folder storing the updated document data 100a and its upper folders in those folders. A hash value corresponding to the contents of the document hash values of all the document data 100a and the contents of the folder hash values of the folder one level lower is generated. Here, the folder hash value when there is no lower folder corresponds to the contents of the document hash values of all the document data 100a stored in the folder. In addition, the folder hash value when there is a lower folder is the contents of all the document data 100a stored in that folder and all the document data 100a stored in all lower folders than that folder. Corresponds to the content. Therefore, by comparing the folder hash values, it is determined whether or not there is a document data 100a stored in the folder and a folder lower than the folder that has a different content from the document data 100b. Can do. Thus, the folder hash value is digest data reflecting the contents of all the document data 100a stored in the folder and all the document components 190a constituting the document data 100a.

そして統合ハッシュ値生成部62は、上述のようにして生成した文書ハッシュ値およびフォルダハッシュ値を、ハッシュ値・統合ハッシュ値記憶部32に設けられた統合ハッシュ値記憶部35に格納する。このとき、統合ハッシュ値生成部62は、統合ハッシュ値記憶部35に既に格納されている文書ハッシュ値およびフォルダハッシュ値を、上述のようにして生成した文書ハッシュ値およびフォルダハッシュ値で書き換えることにより、文書ハッシュ値およびフォルダハッシュ値を更新する。   The integrated hash value generation unit 62 stores the document hash value and the folder hash value generated as described above in the integrated hash value storage unit 35 provided in the hash value / integrated hash value storage unit 32. At this time, the integrated hash value generation unit 62 rewrites the document hash value and the folder hash value already stored in the integrated hash value storage unit 35 with the document hash value and the folder hash value generated as described above. Update the document hash value and folder hash value.

ハッシュ値・統合ハッシュ値送信部65は、情報処理装置11aにおいてユーザが文書データ100bを閲覧等しようとした場合に情報処理装置11aから送信される、ハッシュ値・統合ハッシュ値要求を受信した場合に機能し、情報処理装置11bにハッシュ値および統合ハッシュ値を送信する。具体的には、フォルダ200aのフォルダハッシュ値、文書データ100aの文書ハッシュ値、および文書構成要素190aのハッシュ値を、ハッシュ値・統合ハッシュ値記憶部32から読み込み、これを情報処理装置11aに送信する。   The hash value / integrated hash value transmission unit 65 receives a hash value / integrated hash value request transmitted from the information processing apparatus 11a when the user tries to view the document data 100b in the information processing apparatus 11a. Functions and transmits the hash value and the integrated hash value to the information processing apparatus 11b. Specifically, the folder hash value of the folder 200a, the document hash value of the document data 100a, and the hash value of the document component 190a are read from the hash value / integrated hash value storage unit 32 and transmitted to the information processing apparatus 11a. To do.

文書構成要素送信部66は、データ判別処理を終えた情報処理装置11aから送信される文書構成要素送信要求を受信した場合に、当該送信要求された文書構成要素190aを送信する。具体的には、情報処理装置11aが送信した文書構成要素送信要求から、送信対象となる文書構成要素190aを特定し、特定した文書構成要素190aを文書データ記憶部31から読み込んで、情報処理装置11aに送信する。   When the document component transmission unit 66 receives a document component transmission request transmitted from the information processing apparatus 11a that has completed the data determination process, the document component transmission unit 66 transmits the document component 190a requested to be transmitted. Specifically, the document constituent element 190a to be transmitted is specified from the document constituent element transmission request transmitted by the information processing apparatus 11a, the specified document constituent element 190a is read from the document data storage unit 31, and the information processing apparatus is read. To 11a.

次に情報処理装置11aにおける具体的な内部機能について説明する。図8は、情報処理装置11aの制御部40がシステムプログラム53およびアプリケーションプログラム54を実行することによって実現される詳細な機能構成を示すブロック図である。尚、図8では、例えばユーザが文書データ100bが格納されているフォルダ200bを選択してクリック操作した場合に、文書データ100aと文書データ100bを同一内容にするため、文書管理装置1から送信されてくるハッシュ値・統合ハッシュ値により、文書構成要素190bと異なる内容の文書構成要素190aが存在するが否かを判定し、存在するならば、その文書構成要素190aの送信要求を行い、その文書構成要素190aによって情報処理装置11aが保持する文書構成要素190bを更新する機能に関するブロックのみを示しており、それ以外の機能については図示を省略している。   Next, specific internal functions in the information processing apparatus 11a will be described. FIG. 8 is a block diagram illustrating a detailed functional configuration that is realized when the control unit 40 of the information processing apparatus 11 a executes the system program 53 and the application program 54. In FIG. 8, for example, when the user selects and clicks on the folder 200b in which the document data 100b is stored, the document data 100a and the document data 100b are transmitted from the document management apparatus 1 so as to have the same contents. Based on the hash value / integrated hash value, it is determined whether or not there is a document component 190a having a content different from that of the document component 190b. If it exists, a transmission request for the document component 190a is made, and the document Only the block relating to the function of updating the document component 190b held by the information processing apparatus 11a by the component 190a is shown, and the other functions are not shown.

図8に示すように、制御部40は、プログラム53および54を実行することにより、文書データ管理部70、ハッシュ値・統合ハッシュ値要求部71、データ判別部72、文書構成要素要求部73、データ更新部74として機能する。   As shown in FIG. 8, the control unit 40 executes the programs 53 and 54, thereby executing a document data management unit 70, a hash value / integrated hash value request unit 71, a data determination unit 72, a document component request unit 73, It functions as the data update unit 74.

文書データ管理部70は、文書データ100bの内容を変更したり、閲覧等できるように、文書データを管理する。具体的には、文書データ管理部70は、アプリケーションプログラム54の機能によって、文書データ記憶部51に格納されている文書構成要素190bを読み込んだユーザが、その文書構成要素190bの内容を変更した場合、変更後の文書構成要素190bを文書管理装置1に送信し、また文書データ記憶部51に格納されている変更前の文書構成要素190bの内容を、当該変更後の文書構成要素190bの内容に書き換える。尚、文書管理装置1に送信された変更後の文書構成要素190bは、文書データ更新部60によって処理されることになる。また、ユーザが、例えば文書データ100bを閲覧等しようとして、入力部45を介してフォルダ200bをクリックすれば、文書データ管理部70に設けられたハッシュ値・統合ハッシュ値要求部71が機能し、文書管理装置1に対して、フォルダ200aのフォルダハッシュ値、文書データ100aの文書ハッシュ値、および文書構成要素190aのハッシュ値の送信を要求する。   The document data management unit 70 manages the document data so that the contents of the document data 100b can be changed or viewed. Specifically, the document data management unit 70 uses the function of the application program 54 when the user who has read the document component 190b stored in the document data storage unit 51 changes the contents of the document component 190b. The changed document component 190b is transmitted to the document management apparatus 1, and the content of the document component 190b before the change stored in the document data storage unit 51 is changed to the content of the document component 190b after the change. rewrite. The changed document component 190b transmitted to the document management apparatus 1 is processed by the document data update unit 60. If the user clicks on the folder 200b via the input unit 45 in order to browse the document data 100b, for example, the hash value / integrated hash value request unit 71 provided in the document data management unit 70 functions. The document management apparatus 1 is requested to transmit the folder hash value of the folder 200a, the document hash value of the document data 100a, and the hash value of the document component 190a.

データ判別部72は、ハッシュ値・統合ハッシュ値要求部71が文書管理装置1に対してハッシュ値および統合ハッシュ値を要求した場合に機能し、文書構成要素190bと異なる文書構成要素190aが文書管理装置1で保持されている場合、これを特定する。具体的には、データ判別部72は、まず、文書管理装置1からハッシュ値および統合ハッシュ値を受信し、受信したハッシュ値および統合ハッシュ値を用いて、文書データ100bと内容が異なる文書データ100aが存在するか否かを判別する。異なるデータが存在している場合、次にその文書データ100aに含まれる複数の文書構成要素190aのうち、文書構成要素190bと内容が異なる文書構成要素190aを全て特定する。また、データ判別部72は、文書管理装置1から受信したハッシュ値および統合ハッシュ値を、メモリ42に一時的に格納する。   The data discriminating unit 72 functions when the hash value / integrated hash value requesting unit 71 requests a hash value and an integrated hash value from the document management apparatus 1, and a document component 190a different from the document component 190b is managed by the document. If it is held by the device 1, this is specified. Specifically, the data discriminating unit 72 first receives a hash value and an integrated hash value from the document management apparatus 1, and uses the received hash value and integrated hash value to change the document data 100a whose contents are different from the document data 100b. It is determined whether or not exists. When different data exists, all of the document components 190a having different contents from the document component 190b are specified among the plurality of document components 190a included in the document data 100a. Further, the data determination unit 72 temporarily stores the hash value and the integrated hash value received from the document management apparatus 1 in the memory 42.

文書構成要素要求部73は、文書管理装置1に対して、データ判別部72が行う上記データ判別方法によって特定された文書構成要素190aの送信要求を行う。   The document component request unit 73 makes a transmission request for the document component 190 a specified by the data determination method performed by the data determination unit 72 to the document management apparatus 1.

データ更新部74は、文書構成要素要求部73が送信要求を行った場合に機能し、文書構成要素190bと、ハッシュ値および統合ハッシュ値とを更新する。具体的には、まず、文書構成要素要求部73が文書管理装置1に対して送信要求した文書構成要素190aを受信し、文書データ記憶部51に格納されている文書構成要素190bの内容を、当該受信した文書構成要素190aの内容に書き換える。そして、ハッシュ値・統合ハッシュ値記憶部52に格納されている、上述の書き換えを行う前の文書構成要素190bのハッシュ値、その文書構成要素190bにより構成される文書データ100bの文書ハッシュ値、その文書データ100bを格納するフォルダ200bのフォルダハッシュ値、およびそのフォルダ200aの上位フォルダのフォルダハッシュ値を、上述した、データ判別部72が一時的にメモリ42に格納したハッシュ値・統合ハッシュ値に書き換える。   The data update unit 74 functions when the document component request unit 73 makes a transmission request, and updates the document component 190b, the hash value, and the integrated hash value. Specifically, first, the document component request unit 73 receives the document component 190a requested to be transmitted to the document management apparatus 1, and the contents of the document component 190b stored in the document data storage unit 51 are The content of the received document component 190a is rewritten. Then, the hash value of the document component element 190b stored in the hash value / integrated hash value storage unit 52 before the rewriting described above, the document hash value of the document data 100b configured by the document component element 190b, The folder hash value of the folder 200b for storing the document data 100b and the folder hash value of the upper folder of the folder 200a are rewritten to the hash value / integrated hash value temporarily stored in the memory 42 by the data determination unit 72 described above. .

このデータ更新部74による文書構成要素190bの更新により、文書管理装置1と情報処理装置11aとで、文書データ100aと文書データ100bは、全て同一内容となる。従って、ユーザは、情報処理装置11aにより、文書管理装置1で保持されている文書データ100aと同一内容の文書データ100bを閲覧等することができるようになる。また、上述のように文書構成要素190bが更新されることにより、情報処理装置11aは、自機が保持する文書構成要素190bの内容と対応しないハッシュ値、自機が保持する文書データ100bの内容と対応しない文書ハッシュ値、および自機が保持するフォルダ200bの内容と対応しないフォルダハッシュ値、を保持することになるが、データ更新部74によりハッシュ値および統合ハッシュ値が更新されれば、情報処理装置11aは、自機が保持する文書構成要素190bの内容、文書データ100bの内容、およびフォルダ200bの内容と対応したハッシュ値および統合ハッシュ値を保持することになる。従って、再びユーザがフォルダ200bをクリックして、データ判別部72が、データ判別を行うことになっても、ハッシュ値・統合ハッシュ値記憶部52に格納されたハッシュ値・統合ハッシュ値を用いて行えばよいので、自機が保持する文書構成要素190bのハッシュ値、自機が保持する文書データ100bの文書ハッシュ値、および自機が保持するフォルダ200bのフォルダハッシュ値を生成する必要はなく、文書管理システムのパフォーマンスの低下を回避することができる。   By updating the document component 190b by the data updating unit 74, the document data 100a and the document data 100b all have the same contents in the document management apparatus 1 and the information processing apparatus 11a. Therefore, the user can browse the document data 100b having the same contents as the document data 100a held in the document management apparatus 1 by the information processing apparatus 11a. In addition, by updating the document component 190b as described above, the information processing apparatus 11a causes the hash value not corresponding to the content of the document component 190b held by the own device and the content of the document data 100b held by the own device. The document hash value that does not correspond to the folder hash value and the folder hash value that does not correspond to the contents of the folder 200b held by the own device are stored. If the hash value and the integrated hash value are updated by the data update unit 74, information is stored. The processing apparatus 11a holds the hash value and the integrated hash value corresponding to the contents of the document component 190b, the contents of the document data 100b, and the contents of the folder 200b held by the processing apparatus 11a. Therefore, even if the user clicks on the folder 200b again and the data determination unit 72 performs data determination, the hash value / integrated hash value stored in the hash value / integrated hash value storage unit 52 is used. Therefore, it is not necessary to generate the hash value of the document component 190b held by the own device, the document hash value of the document data 100b held by the own device, and the folder hash value of the folder 200b held by the own device. A decrease in the performance of the document management system can be avoided.

また、本実施形態において、データ判別は、文書管理装置1が行わずに情報処理装置11が行うこととしている。これにより、文書管理装置1にかかる処理負担を軽減させている。特に、文書管理装置1とネットワーク10を介しデータ通信可能に接続されている情報処理装置11の数が多くなればなるほど、文書管理装置1に対する情報処理装置11からのデータ処理要求が多くなり文書管理装置1の処理負担が増えるので、情報処理装置11がデータ判別を行うことによる、文書管理システムのパフォーマンス低下回避の効果が大きくなる。   In the present embodiment, the data discrimination is performed by the information processing apparatus 11 without being performed by the document management apparatus 1. As a result, the processing burden on the document management apparatus 1 is reduced. In particular, as the number of information processing apparatuses 11 connected to the document management apparatus 1 via the network 10 so as to be able to perform data communication increases, the number of data processing requests from the information processing apparatus 11 to the document management apparatus 1 increases. Since the processing load of the apparatus 1 increases, the effect of avoiding the performance deterioration of the document management system due to the data determination performed by the information processing apparatus 11 is increased.

図9は、文書管理装置1が情報処理装置11aから文書構成要素190bを受信する場合の処理手順の一例を示すフローチャートである。文書管理装置1は、情報処理装置11aから、文書構成要素190bを受信したか否かを監視している(ステップS101)。文書管理装置1が文書構成要素190bを受信したならば(ステップS101でYES)、文書データ更新部60が機能し、受信した文書構成要素190bにより文書管理装置1が保持する文書データ100aの更新を行う(ステップS102)。その後、ハッシュ値生成部61が機能し、ステップS101で受信した文書構成要素190bのハッシュ値を生成し(ステップS103)、生成したハッシュ値によりハッシュ値記憶部34に格納されているハッシュ値の更新を行う(ステップS104)。すると統合ハッシュ値生成部62が機能し、ステップS103においてハッシュ値生成部61が生成したハッシュ値から、統合ハッシュ値を生成する(ステップS105)。そしてその後、統合ハッシュ値生成部62は、ステップS105において生成した統合ハッシュ値により、ハッシュ値・統合ハッシュ値記憶部32における統合ハッシュ値記憶部35に格納されている統合ハッシュ値を更新して(ステップS106)、処理を終了する。   FIG. 9 is a flowchart illustrating an example of a processing procedure when the document management apparatus 1 receives the document component 190b from the information processing apparatus 11a. The document management apparatus 1 monitors whether or not the document component 190b is received from the information processing apparatus 11a (step S101). If the document management apparatus 1 receives the document component 190b (YES in step S101), the document data update unit 60 functions to update the document data 100a held in the document management apparatus 1 by the received document component 190b. Perform (step S102). Thereafter, the hash value generation unit 61 functions to generate the hash value of the document component 190b received in step S101 (step S103), and update the hash value stored in the hash value storage unit 34 with the generated hash value Is performed (step S104). Then, the integrated hash value generation unit 62 functions and generates an integrated hash value from the hash value generated by the hash value generation unit 61 in step S103 (step S105). After that, the integrated hash value generation unit 62 updates the integrated hash value stored in the integrated hash value storage unit 35 in the hash value / integrated hash value storage unit 32 with the integrated hash value generated in step S105 ( Step S106) and the process ends.

図10は、文書管理装置1が情報処理装置11aからハッシュ値・統合ハッシュ値要求を受信する場合の処理手順の一例を示すフローチャートである。文書管理装置1は、情報処理装置11aから、ハッシュ値・統合ハッシュ値要求を受信したか否かを監視している(ステップS201)。文書管理装置1がハッシュ値・統合ハッシュ値要求を受信したならば(ステップS201でYES)、ハッシュ値・統合ハッシュ値送信部65が機能し、フォルダ200a、文書データ100a、および文書構成要素190aのハッシュ値・統合ハッシュ値を、情報処理装置11aに送信する(ステップS202)。その後、文書管理装置1は、所定時間以内に、情報処理装置11aから文書構成要素送信要求を受信したか否かを監視する(ステップS203)。文書構成要素送信要求を受信した場合は(ステップS203でYES)、文書構成要素送信部66が機能し、受信した文書構成要素送信要求から、送信対象の文書構成要素190aを特定する(ステップS204)。そしてステップS204で特定した文書構成要素190aを情報処理装置11aに送信して(ステップS205)、処理を終了する。一方、ステップS203で所定時間以内に文書構成要素送信要求を受信しなかった場合は(ステップS203でNO)、文書構成要素190aの送信をせずに処理を終了する。   FIG. 10 is a flowchart illustrating an example of a processing procedure when the document management apparatus 1 receives a hash value / integrated hash value request from the information processing apparatus 11a. The document management apparatus 1 monitors whether or not a hash value / integrated hash value request has been received from the information processing apparatus 11a (step S201). If the document management apparatus 1 receives the hash value / integrated hash value request (YES in step S201), the hash value / integrated hash value transmission unit 65 functions to store the folder 200a, the document data 100a, and the document component 190a. The hash value / integrated hash value is transmitted to the information processing apparatus 11a (step S202). Thereafter, the document management apparatus 1 monitors whether a document component transmission request is received from the information processing apparatus 11a within a predetermined time (step S203). When a document component transmission request is received (YES in step S203), the document component transmission unit 66 functions and identifies the document component 190a to be transmitted from the received document component transmission request (step S204). . Then, the document component 190a specified in step S204 is transmitted to the information processing apparatus 11a (step S205), and the process ends. On the other hand, if the document component transmission request is not received within the predetermined time in step S203 (NO in step S203), the processing is terminated without transmitting the document component 190a.

図11は、情報処理装置11aにおいてユーザがフォルダ200bをクリックする場合の処理手順の一例を示すフローチャートである。文書データ管理部70は、フォルダ200bが入力部45を介してクリックされるか否かを監視している(ステップS301)。共有フォルダ200bがクリックされた場合(ステップS301でYES)、文書データ管理部70に備わるハッシュ値・統合ハッシュ値要求部71が機能し、文書管理装置1に対して、フォルダ200a、文書データ100a、および文書構成要素190aのハッシュ値・統合ハッシュ値の送信を要求する(ステップS302)。その後、データ判別部72が機能し、文書管理装置1からハッシュ値・統合ハッシュ値を受信したか否かを監視する(ステップS303)。ハッシュ値・統合ハッシュ値を受信したならば(ステップS303でYES)、データ判別部72が機能して、受信したハッシュ値・統合ハッシュ値をメモリ42に一時的に格納し(ステップS304)、その後データ判別処理を行う(ステップS305)。このデータ判別処理において、文書データ100bと異なる内容の文書データ100aが存在すると判定された場合(ステップS306でYES)、文書構成要素要求部73が機能し、データ判別処理において特定された文書構成要素190aの送信を、文書管理装置1に対して要求する(ステップS307)。すると、データ更新部74が機能し、文書管理装置1から文書構成要素190aを受信したか否かを監視する(ステップS308)。文書構成要素190aを受信した場合(ステップS308でYES)、文書データ記憶部51に格納されている文書構成要素190bの内容を、当該受信した文書構成要素190aの内容に書き換える(ステップS309)。また、ハッシュ値・統合ハッシュ値記憶部52に格納されているハッシュ値・統合ハッシュ値を、ステップS304でデータ判別部72が一時的にメモリ42に格納したハッシュ値・統合ハッシュ値に書き換え(ステップS310)、処理を終了する。一方、ステップS305のデータ判別処理において、文書データ100bと異なる内容の文書データ100aが存在しないと判定された場合(ステップS306でNO)、文書構成要素およびハッシュ値・統合ハッシュ値の更新は行わずに処理を終了する。   FIG. 11 is a flowchart illustrating an example of a processing procedure when the user clicks the folder 200b in the information processing apparatus 11a. The document data management unit 70 monitors whether or not the folder 200b is clicked via the input unit 45 (step S301). When the shared folder 200b is clicked (YES in step S301), the hash value / integrated hash value request unit 71 provided in the document data management unit 70 functions, and the folder 200a, the document data 100a, The transmission of the hash value / integrated hash value of the document component 190a is requested (step S302). Thereafter, the data determination unit 72 functions to monitor whether or not a hash value / integrated hash value has been received from the document management apparatus 1 (step S303). If the hash value / integrated hash value is received (YES in step S303), the data discriminating unit 72 functions to temporarily store the received hash value / integrated hash value in the memory 42 (step S304). Data discrimination processing is performed (step S305). If it is determined in this data determination process that there is document data 100a having a different content from the document data 100b (YES in step S306), the document component request unit 73 functions and the document component specified in the data determination process is determined. The document management apparatus 1 is requested to transmit 190a (step S307). Then, the data update unit 74 functions and monitors whether or not the document component 190a is received from the document management apparatus 1 (step S308). When the document component 190a is received (YES in step S308), the content of the document component 190b stored in the document data storage unit 51 is rewritten to the content of the received document component 190a (step S309). Further, the hash value / integrated hash value stored in the hash value / integrated hash value storage unit 52 is rewritten to the hash value / integrated hash value temporarily stored in the memory 42 by the data determination unit 72 in step S304 (step S304). S310), the process is terminated. On the other hand, if it is determined in the data determination process in step S305 that there is no document data 100a having a different content from the document data 100b (NO in step S306), the document component and the hash value / integrated hash value are not updated. The process ends.

図12は、データ判定処理(図11のステップS305)の詳細な処理手順の一例を示すフローチャートである。まず、データ判別部72は、メモリ42に格納されたフォルダ200a、文書データ100a、および文書構成要素190aのハッシュ値・統合ハッシュ値を読み込み、更にハッシュ値・統合ハッシュ値記憶部52からフォルダ200b、文書データ100b、および文書構成要素190bのハッシュ値・統合ハッシュ値を読み込む(ステップS401)。ここでメモリ42に格納されているハッシュ値・統合ハッシュ値は、図11のステップS304において格納したものであり、ハッシュ値・統合ハッシュ値記憶部52に格納されているハッシュ値・統合ハッシュ値は、図11のステップS310において更新されたハッシュ値・統合ハッシュ値を含んでいる。次にフォルダ200aのうちの最上位フォルダおよび200bのうちの最上位フォルダを特定し(ステップS402)、フォルダ200aのうちの最上位フォルダのフォルダハッシュ値とフォルダ200bのうちの最上位フォルダのフォルダハッシュ値とを比較する(ステップS403)。フォルダハッシュ値が等しい場合は(ステップS404でYES)、何もせずにデータ判別処理を終了する。フォルダハッシュ値が異なる場合は(ステップS404でNO)、次に当該フォルダ200bに格納されている文書データ100bと当該フォルダ200aに格納されている文書データ100aとで文書ハッシュ値が異なるものが存在するか否かを判定する(ステップS405)。存在する場合は(ステップS405でYES)、当該文書データ100aと当該文書データ100bとで文書ハッシュ値とを比較する(ステップS406)。文書ハッシュ値が異なる文書データ100aおよび文書データ100bが存在する場合は(ステップS407でYES)、当該文書データ100aに含まれる文書構成要素190aのハッシュ値と、当該文書データ100bに含まれる文書構成要素190bのハッシュ値とを比較する(ステップS408)。そして、文書構成要素190bと異なるハッシュ値を有する文書構成要素190aを特定し(ステップS409)、次に下位のフォルダが存在するか否かを判定する(ステップS410)。下位のフォルダが存在しない場合は(ステップS410でNO)、データ判定処理を終了する。一方、当該フォルダ200aに文書データ100aが存在しないか(ステップS405でNO)、当該フォルダに文書データは存在するが(ステップS405でYES)、文書ハッシュ値が異なる文書データが存在しないか(ステップS407でNO)、または当該フォルダに文書データが存在し、それらの文書データのうちで異なる文書ハッシュ値を有するものも存在するが、更に下位のフォルダが存在する場合は(ステップS410でYES)、当該フォルダの1つ下位のフォルダを特定し(ステップS411)、再びステップS403以降の上記プロセスを繰り返す。   FIG. 12 is a flowchart illustrating an example of a detailed processing procedure of the data determination process (step S305 in FIG. 11). First, the data determination unit 72 reads the hash value / integrated hash value of the folder 200a, the document data 100a, and the document component 190a stored in the memory 42, and further reads the folder 200b from the hash value / integrated hash value storage unit 52, The hash value / integrated hash value of the document data 100b and the document component 190b are read (step S401). The hash value / integrated hash value stored in the memory 42 is the one stored in step S304 in FIG. 11, and the hash value / integrated hash value stored in the hash value / integrated hash value storage unit 52 is The hash value / integrated hash value updated in step S310 of FIG. 11 is included. Next, the highest folder of the folder 200a and the highest folder of the 200b are specified (step S402), and the folder hash value of the highest folder of the folder 200a and the folder hash of the highest folder of the folder 200b are identified. The values are compared (step S403). If the folder hash values are equal (YES in step S404), the data discrimination process is terminated without doing anything. If the folder hash values are different (NO in step S404), the document data 100b stored in the folder 200b and the document data 100a stored in the folder 200a have different document hash values. Is determined (step S405). If it exists (YES in step S405), the document hash value is compared between the document data 100a and the document data 100b (step S406). If document data 100a and document data 100b having different document hash values exist (YES in step S407), the hash value of the document component 190a included in the document data 100a and the document component included in the document data 100b The hash value of 190b is compared (step S408). Then, the document component 190a having a hash value different from that of the document component 190b is specified (step S409), and it is determined whether or not a next lower folder exists (step S410). If there is no lower folder (NO in step S410), the data determination process is terminated. On the other hand, the document data 100a does not exist in the folder 200a (NO in step S405), or the document data exists in the folder (YES in step S405), but there is no document data having a different document hash value (step S407). No), or there is document data in the folder, and some of the document data have different document hash values, but if there is a lower folder (YES in step S410), A folder one level lower than the folder is specified (step S411), and the above-described process after step S403 is repeated again.

図13、図14、および図15は、いずれも図12におけるデータ判別処理を、具体例により説明するための図である。図例では、文書管理装置1における文書データ記憶部31のデータ保持構造として、最上位フォルダのフォルダ220aを備え、このフォルダ220aに、文書データ140a及び150aと、その下位フォルダとなるフォルダ210aとが格納されている。フォルダ210aには、文書データ110a,120a,130aが格納されている。また、情報処理装置11aにおいて文書データ記憶部51には、文書管理装置1のデータ保持構造と対応するように、最上位フォルダのフォルダ220bを備え、このフォルダ220bに、文書データ140b及び150bと、その下位フォルダとなるフォルダ210bとが格納されている。フォルダ210bには、文書データ110b,120b,130bが格納されている。そして図13、図14、および図15では文書管理装置1のデータ保持構造に対応したハッシュ値及び統合ハッシュ値と、情報処理装置11aのデータ保持構造に対応したハッシュ値及び統合ハッシュ値との比較を行う場合を例示する。   13, FIG. 14, and FIG. 15 are diagrams for explaining the data determination processing in FIG. 12 by a specific example. In the illustrated example, the data storage structure of the document data storage unit 31 in the document management apparatus 1 includes a folder 220a of the highest folder, and the folder 220a includes document data 140a and 150a and a folder 210a that is a lower folder thereof. Stored. Document data 110a, 120a, and 130a are stored in the folder 210a. Further, in the information processing apparatus 11a, the document data storage unit 51 includes a folder 220b of the highest folder so as to correspond to the data holding structure of the document management apparatus 1, and the folder 220b includes document data 140b and 150b, A folder 210b, which is a lower folder, is stored. The folder 210b stores document data 110b, 120b, and 130b. 13, 14, and 15, the hash value and the integrated hash value corresponding to the data holding structure of the document management apparatus 1 are compared with the hash value and the integrated hash value corresponding to the data holding structure of the information processing apparatus 11 a. The case where it performs is illustrated.

図13は、文書データ110aの内容と文書データ110bの内容が異なる場合の図である。この例では、文書本体データ111aの内容と文書本体データ111bの内容とが異なっており、またセキュリティ情報114aの内容とセキュリティ情報114bの内容とが異なっている。この場合、文書本体データ111aのハッシュ値と、文書本体データ111bのハッシュ値が異なる。またセキュリティ情報114aのハッシュ値と、セキュリティ情報114bのハッシュ値も異なる。そのため、文書データ110aの文書ハッシュ値と、文書データ110bの文書ハッシュ値が異なることとなり、さらにフォルダ210aのフォルダハッシュ値と、フォルダ210bのフォルダハッシュ値とが異なることとなる。その結果、最上位フォルダであるフォルダ220aのフォルダハッシュ値と、フォルダ220bのフォルダハッシュ値とが異なることとなる。   FIG. 13 is a diagram when the contents of the document data 110a and the contents of the document data 110b are different. In this example, the contents of the document body data 111a and the contents of the document body data 111b are different, and the contents of the security information 114a and the contents of the security information 114b are different. In this case, the hash value of the document body data 111a is different from the hash value of the document body data 111b. Also, the hash value of the security information 114a is different from the hash value of the security information 114b. For this reason, the document hash value of the document data 110a and the document hash value of the document data 110b are different, and the folder hash value of the folder 210a and the folder hash value of the folder 210b are different. As a result, the folder hash value of the folder 220a that is the highest folder is different from the folder hash value of the folder 220b.

この場合、データ判別処理において文書管理装置1および情報処理装置11aのデータ保持構造に基づき、最上位フォルダであるフォルダ220aのフォルダハッシュ値とフォルダ220bのフォルダハッシュ値との比較が行われる。これらフォルダハッシュ値が互いに異なる値であるので、次に、文書データ140a,150aの文書ハッシュ値と、文書データ140b,150bの文書ハッシュ値との比較が個別に行われる。これらはいずれも等しい値となるので、次に、その下位のフォルダ210a,210bが特定され、フォルダ210aのフォルダハッシュ値とフォルダ210bのフォルダハッシュ値との比較が行われる。これらフォルダハッシュ値が互いに異なる値である。そのため、次に、文書データ110a,120a,130aの文書ハッシュ値と、文書データ110b,120b,130bの文書ハッシュ値との比較が個別に行われる。その結果、文書ハッシュ値が互いに異なる文書データ110a,110bが特定される。そのため、文書データ110aを構成する文書構成要素111a,112a,113a,114aの各ハッシュ値と、文書データ110bを構成する文書構成要素111b,112b,113b,114bの各ハッシュ値とが比較され、文書管理装置1で保持されている文書本体データ111aとセキュリティ情報114aとの2つの文書構成要素が、情報処理装置11aで保持している文書構成要素と異なった内容であることを特定することができる。   In this case, based on the data holding structure of the document management apparatus 1 and the information processing apparatus 11a in the data determination process, the folder hash value of the folder 220a, which is the highest folder, is compared with the folder hash value of the folder 220b. Since these folder hash values are different from each other, the comparison between the document hash values of the document data 140a and 150a and the document hash values of the document data 140b and 150b is performed individually. Since both are equal values, the lower folders 210a and 210b are specified, and the folder hash value of the folder 210a and the folder hash value of the folder 210b are compared. These folder hash values are different from each other. Therefore, next, the document hash values of the document data 110a, 120a, and 130a and the document hash values of the document data 110b, 120b, and 130b are individually compared. As a result, document data 110a and 110b having different document hash values are specified. Therefore, the hash values of the document constituent elements 111a, 112a, 113a, 114a constituting the document data 110a are compared with the hash values of the document constituent elements 111b, 112b, 113b, 114b constituting the document data 110b, and the document It can be specified that the two document constituent elements of the document main body data 111a and the security information 114a held in the management apparatus 1 have different contents from the document constituent elements held in the information processing apparatus 11a. .

この例では、文書管理装置1と情報処理装置11aのそれぞれが、4つの文書構成要素からなる5つの文書データを保持している。そのため、文書管理装置1と情報処理装置11aのそれぞれで保持される文書構成要素の数は20個である。この場合において、例えば従来のような比較処理を行えば、異なる内容の文書構成要素を全て特定するために20回の比較処理が必要になる。これに対し、本実施形態のように、ハッシュ値および統合ハッシュ値を用いた比較処理によれば、フォルダ220a、文書データ140a、文書データ150a、フォルダ210a、文書データ130a、文書データ120a、文書データ110a、文書本体データ111a、サムネイル112a、データベース113a、およびセキュリティ情報114aのハッシュ値又は統合ハッシュ値の比較処理を行えば良いので、合計11回の比較処理で、文書管理装置1と情報処理装置11aとで保持される異なる内容の文書構成要素を全て特定することが可能である。   In this example, each of the document management apparatus 1 and the information processing apparatus 11a holds five document data composed of four document components. Therefore, the number of document components held by each of the document management apparatus 1 and the information processing apparatus 11a is 20. In this case, for example, if a conventional comparison process is performed, 20 comparison processes are required to specify all document components having different contents. On the other hand, according to the comparison process using the hash value and the integrated hash value as in the present embodiment, the folder 220a, document data 140a, document data 150a, folder 210a, document data 130a, document data 120a, document data 110a, the document body data 111a, the thumbnail 112a, the database 113a, and the hash value or integrated hash value of the security information 114a may be compared. Thus, the document management apparatus 1 and the information processing apparatus 11a are compared in a total of 11 comparison processes. It is possible to specify all the document components having different contents held in and.

次に、図14は、文書データ140aの文書構成要素であるサムネイル107の内容が異なっている場合の図である。この例では、サムネイル107aのハッシュ値と、サムネイル107bのハッシュ値とが異なっており、それに伴って文書データ140aの文書ハッシュ値と、文書データ140bの文書ハッシュ値とも異なっている。   Next, FIG. 14 is a diagram in the case where the contents of the thumbnail 107 which is the document component of the document data 140a are different. In this example, the hash value of the thumbnail 107a and the hash value of the thumbnail 107b are different, and accordingly, the document hash value of the document data 140a and the document hash value of the document data 140b are also different.

この場合、データ判別処理において文書管理装置1および情報処理装置11aのデータ保持構造に基づき、最上位フォルダであるフォルダ220aのフォルダハッシュ値とフォルダ220bのフォルダハッシュ値との比較が行われる。これらフォルダハッシュ値が互いに異なる値であるので、次に、文書データ140a,150aの文書ハッシュ値と、文書データ140b,150bの文書ハッシュ値との比較が個別に行われる。そして文書データ140aの文書ハッシュ値と、文書データ140bの文書ハッシュ値とが異なることになる。そして文書データ140aを構成する文書構成要素106a,107a,108a,109aの各ハッシュ値と、文書データ140bを構成する文書構成要素106b,107b,108b,109bの各ハッシュ値とが比較され、文書管理装置1で保持されているサムネイル107aの1つの文書構成要素が、情報処理装置11aで保持している文書構成要素と異なった内容であることを特定することができる。   In this case, based on the data holding structure of the document management apparatus 1 and the information processing apparatus 11a in the data determination process, the folder hash value of the folder 220a, which is the highest folder, is compared with the folder hash value of the folder 220b. Since these folder hash values are different from each other, the comparison between the document hash values of the document data 140a and 150a and the document hash values of the document data 140b and 150b is performed individually. Then, the document hash value of the document data 140a is different from the document hash value of the document data 140b. Then, the hash values of the document constituent elements 106a, 107a, 108a, 109a constituting the document data 140a are compared with the hash values of the document constituent elements 106b, 107b, 108b, 109b constituting the document data 140b, and document management is performed. It can be specified that one document component of the thumbnail 107a held by the apparatus 1 has a different content from the document component held by the information processing apparatus 11a.

この例では、ハッシュ値および統合ハッシュ値を用いた比較処理により、上述のようにフォルダ220a、文書データ140a、文書データ150a、フォルダ220a、文書本体データ106a、サムネイル107a、データベース108a、およびセキュリティ情報109aのハッシュ値又は統合ハッシュ値の比較処理を行えば良いので、合計8回の比較処理で、文書管理装置1と情報処理装置11aとで保持される異なる内容の文書構成要素を全て特定することが可能である。   In this example, the folder 220a, the document data 140a, the document data 150a, the folder 220a, the document body data 106a, the thumbnail 107a, the database 108a, and the security information 109a are compared by the comparison process using the hash value and the integrated hash value as described above. Since the comparison processing of the hash value or the integrated hash value may be performed, all document constituent elements having different contents held in the document management apparatus 1 and the information processing apparatus 11a can be specified by a total of eight comparison processes. Is possible.

次に、図15は、全ての文書データの内容が等しい場合の図である。この場合、文書管理装置1と情報処理装置11aとで保持される、フォルダ、文書データ、および文書構成要素のハッシュ値又は統合ハッシュ値は全て等しい。この例では、フォルダ220aのフォルダハッシュ値と、フォルダ220bのフォルダハッシュ値とが比較されると、それらフォルダハッシュ値は互いに等しいので、その時点で異なる内容の文書構成要素が存在しないということを特定することができる。したがって、この場合の比較処理の回数は、1回となり、効率的にデータ判別処理を終了することができる。   Next, FIG. 15 is a diagram when the contents of all the document data are equal. In this case, the hash value or integrated hash value of the folder, document data, and document constituent elements held in the document management apparatus 1 and the information processing apparatus 11a are all equal. In this example, when the folder hash value of the folder 220a and the folder hash value of the folder 220b are compared, the folder hash values are equal to each other, and therefore it is determined that there are no document components having different contents at that time. can do. Therefore, the number of comparison processes in this case is one, and the data determination process can be efficiently completed.

このように本実施形態では、文書管理装置1と情報処理装置11とで異なる内容の文書データを保持しているか否かの判別を行う際、または、異なる内容の文書構成要素を特定する際に、ハッシュ値および統合ハッシュ値を用いることにより、従来よりも少ない比較回数で判別や特定を行うことができるようになる。そのため、文書管理システムのパフォーマンスの低下を回避することが可能である。そして、このような比較が行われた後、この比較結果に基づいて、文書管理装置1から情報処理装置11へ異なる内容の文書構成要素が送信され、情報処理装置11において当該文書構成要素の更新が行われれば、ユーザは、文書管理装置1が保持する文書データと同一内容の文書データを、情報処理装置11で利用することができるようになる。   As described above, in this embodiment, when it is determined whether or not the document management apparatus 1 and the information processing apparatus 11 hold document data having different contents, or when document components having different contents are specified. By using the hash value and the integrated hash value, discrimination and identification can be performed with a smaller number of comparisons than in the past. Therefore, it is possible to avoid a decrease in the performance of the document management system. Then, after such a comparison is performed, based on the comparison result, document components having different contents are transmitted from the document management device 1 to the information processing device 11, and the information processing device 11 updates the document components. In this case, the user can use the document data having the same content as the document data held by the document management apparatus 1 in the information processing apparatus 11.

(変形例)
以上、本発明に関するいくつかの実施形態について説明したが、本発明は上述した内容に限られるものではなく、種々の変形例が適用可能である。以下でいくつかの変形例を挙げる。
(Modification)
As mentioned above, although several embodiment regarding this invention was described, this invention is not limited to the content mentioned above, A various modification is applicable. Some variations are given below.

例えば上記実施形態においては、特に図11において示されるように、情報処理装置11がハッシュ値および統合ハッシュ値の送信要求を文書管理装置1に対して行うのは、ユーザがフォルダを選択してクリック操作した際に行われるように設定されているが、これに限らず、例えば定期的に行ってもよいし、また情報処理装置11の電源がオンとなった時に行うようにしてもよい。また、フォルダのクリック操作に限られず、例えば文書データの選択操作が行われた場合に行うこととしてもよい。またその他の入力操作であってもよい。   For example, in the above embodiment, as shown in FIG. 11 in particular, the information processing apparatus 11 makes a transmission request for the hash value and the integrated hash value to the document management apparatus 1 because the user selects a folder and clicks However, the present invention is not limited to this, and may be performed periodically, for example, or may be performed when the information processing apparatus 11 is turned on. Further, the operation is not limited to a folder click operation, and may be performed when, for example, a document data selection operation is performed. Other input operations may be used.

また上記実施形態においては、ハッシュ値を生成するハッシュ関数と、文書ハッシュ値を生成するハッシュ関数と、フォルダハッシュ値を生成するハッシュ関数とが同一のハッシュ関数である場合を例示したが、これに限られるものではない。   In the above embodiment, the hash function for generating the hash value, the hash function for generating the document hash value, and the hash function for generating the folder hash value are exemplified as the same hash function. It is not limited.

また上記実施形態においては、ハッシュ値および統合ハッシュ値の生成は、文書管理装置1が行うものとされているが、情報処理装置11が行ってもよいし、文書管理装置1と情報処理装置11との双方が行うようにしてもよい。   In the above embodiment, generation of the hash value and the integrated hash value is performed by the document management apparatus 1. However, the information processing apparatus 11 may perform the hash value and the integrated hash value, or the document management apparatus 1 and the information processing apparatus 11. Both of them may be performed.

また上記実施形態においては、文書管理装置1と情報処理装置11とで異なる内容の文書データを保持しているか否かのデータ判別処理を情報処理装置11で行う場合を例示したが、これに限られるものでもない。例えば、文書管理装置1で上述したデータ判別処理(図12)を行うようにしても良い。ただし、この場合、文書管理装置1が、情報処理装置11に対してハッシュ値および統合ハッシュ値の送信要求することにより、情報処理装置11におけるデータ保持構造に対応したハッシュ値および統合ハッシュ値を情報処理装置11から取得することが必要になる。   In the above-described embodiment, the case where the information processing apparatus 11 performs data determination processing for determining whether or not the document management apparatus 1 and the information processing apparatus 11 hold document data having different contents is illustrated. It is not something that can be done. For example, the data determination process (FIG. 12) described above may be performed by the document management apparatus 1. However, in this case, the document management apparatus 1 requests the information processing apparatus 11 to transmit the hash value and the integrated hash value, thereby obtaining the hash value and the integrated hash value corresponding to the data holding structure in the information processing apparatus 11 as information. It is necessary to obtain from the processing device 11.

また上記実施形態においては、データ判別処理を行う際、文書管理装置1から情報処理装置11に対してハッシュ値と統合ハッシュ値の双方をまとめて送信する場合を例示したが、これに限られるものでもない。すなわち、まず最上位フォルダに対応するフォルダハッシュ値を送信し、そのフォルダハッシュ値が異なる値と判定されれば、次に文書ハッシュ値や下位フォルダのフォルダハッシュ値などを送信するようにして、統合ハッシュ値とハッシュ値とを段階的に送信する構成としてもよい。この場合、ハッシュ値送受信時におけるネットワーク4のトラフィック量を軽減することができるという利点がある。   In the above-described embodiment, the case where both the hash value and the integrated hash value are collectively transmitted from the document management apparatus 1 to the information processing apparatus 11 when performing the data determination process is illustrated, but the present invention is not limited thereto. not. That is, first send the folder hash value corresponding to the top folder, and if the folder hash value is determined to be different, then the document hash value, the folder hash value of the lower folder, etc. are sent next, and integrated The hash value and the hash value may be transmitted step by step. In this case, there is an advantage that the traffic amount of the network 4 at the time of hash value transmission / reception can be reduced.

1 文書管理装置
11 情報処理装置
20、40 制御部
30 記憶装置(文書データ記憶手段)
50 記憶装置(データ記憶手段)
61 ハッシュ値生成部(ダイジェストデータ生成手段)
62 統合ハッシュ値生成部(統合ダイジェストデータ生成手段)
72 データ判別部(データ判別手段)
100,100a,100b 文書データ
101 文書本体データ(文書構成要素)
102 サムネイル(文書構成要素)
103 データベース(文書構成要素)
104 セキュリティ情報(文書構成要素)
190 文書構成要素
200,200a,200b フォルダ(記憶領域、記憶部)
DESCRIPTION OF SYMBOLS 1 Document management apparatus 11 Information processing apparatus 20, 40 Control part 30 Storage apparatus (document data storage means)
50 Storage device (data storage means)
61 Hash value generator (digest data generator)
62. Integrated hash value generator (integrated digest data generator)
72 Data discrimination unit (data discrimination means)
100, 100a, 100b Document data 101 Document body data (document component)
102 Thumbnail (document component)
103 Database (document component)
104 Security information (document component)
190 Document component 200, 200a, 200b Folder (storage area, storage unit)

Claims (9)

所定の記憶部に複数の文書データを記憶する文書データ記憶手段を有し、ネットワークを介して接続された情報処理装置とデータ通信を行うことによって前記記憶部に記憶された複数の文書データと、前記情報処理装置における所定の記憶領域に記憶された複数の文書データとの同一性を保持するように管理する文書管理装置であって、
前記記憶部に記憶された各文書データの内容に対応した文書ダイジェストデータを生成し、前記記憶部に記憶された複数の文書データのそれぞれから生成した複数の文書ダイジェストデータに基づいて、前記複数の文書ダイジェストデータの内容に対応した合成ダイジェストデータを生成する統合ダイジェストデータ生成手段と、
前記記憶部に記憶された複数の文書データと、前記所定の記憶領域に記憶された複数の文書データとで内容が異なるものが存在するか否かを、前記統合ダイジェストデータ生成手段により生成された合成ダイジェストデータの比較により判定するデータ判別手段と、
を備えることを特徴とする文書管理装置。
Document data storage means for storing a plurality of document data in a predetermined storage unit, a plurality of document data stored in the storage unit by performing data communication with an information processing apparatus connected via a network, A document management apparatus that manages to maintain identity with a plurality of document data stored in a predetermined storage area in the information processing apparatus,
Generate document digest data corresponding to the contents of each document data stored in the storage unit, and based on the plurality of document digest data generated from each of the plurality of document data stored in the storage unit, Integrated digest data generation means for generating composite digest data corresponding to the contents of the document digest data;
It is generated by the integrated digest data generation means whether there are different contents between the plurality of document data stored in the storage unit and the plurality of document data stored in the predetermined storage area. Data discriminating means for judging by comparison of composite digest data;
A document management apparatus comprising:
前記データ判別手段は、
前記記憶部に記憶された複数の文書データのうち、前記所定の記憶領域に記憶された文書データと内容が異なるものを、前記統合ダイジェストデータ生成手段により生成された文書ダイジェストデータの比較により特定することを特徴とする請求項1記載の文書管理装置。
The data discrimination means includes
Among the plurality of document data stored in the storage unit, the one having contents different from the document data stored in the predetermined storage area is specified by comparing the document digest data generated by the integrated digest data generation unit. The document management apparatus according to claim 1.
前記記憶部に記憶される文書データは、複数の文書構成要素から構成されており、
各文書構成要素の内容に対応したダイジェストデータを生成するダイジェストデータ生成手段を更に備え、
前記統合ダイジェストデータ生成手段は、
前記記憶部に記憶された文書データを構成する複数の文書構成要素のそれぞれから生成した複数のダイジェストデータに基づいて、各文書データの内容に対応した文書ダイジェストデータを生成することを特徴とする請求項1または2記載の文書管理装置。
The document data stored in the storage unit is composed of a plurality of document components,
A digest data generating means for generating digest data corresponding to the contents of each document component;
The integrated digest data generation means includes:
The document digest data corresponding to the contents of each document data is generated based on a plurality of digest data generated from each of a plurality of document constituent elements constituting the document data stored in the storage unit. Item 3. The document management apparatus according to Item 1 or 2.
前記データ判別手段は、
前記記憶部に記憶された文書データを構成する複数の文書構成要素のうち、前記所定の記憶領域に記憶された文書データを構成する文書構成要素と内容が異なるものを、前記ダイジェストデータ生成手段により生成されたダイジェストデータの比較により特定することを特徴とする請求項3記載の文書管理装置。
The data discrimination means includes
Among the plurality of document constituent elements constituting the document data stored in the storage unit, those having different contents from the document constituent elements constituting the document data stored in the predetermined storage area are converted by the digest data generating means. 4. The document management apparatus according to claim 3, wherein the document management apparatus is specified by comparing the generated digest data.
所定の記憶部に複数の文書データを記憶する文書データ記憶手段を有し、ネットワークを介して接続された情報処理装置とデータ通信を行うことによって前記記憶部に記憶された複数の文書データと、前記情報処理装置における所定の記憶領域に記憶された複数の文書データとの同一性を保持するように管理する文書管理装置であって、
前記記憶部に記憶された各文書データの内容に対応した文書ダイジェストデータを生成し、前記記憶部に記憶された複数の文書データのそれぞれから生成した複数の文書ダイジェストデータに基づいて、前記複数の文書ダイジェストデータの内容に対応した合成ダイジェストデータを生成する統合ダイジェストデータ生成手段と、
前記記憶部に記憶された複数の文書データと、前記所定の記憶領域に記憶された複数の文書データとで内容が異なるものが存在するか否かを、前記統合ダイジェストデータ生成手段により生成された合成ダイジェストデータの比較により判定させるために、前記情報処理装置に対して前記合成ダイジェストデータを送信するデータ送信手段と、
を備えることを特徴とする文書管理装置。
Document data storage means for storing a plurality of document data in a predetermined storage unit, a plurality of document data stored in the storage unit by performing data communication with an information processing apparatus connected via a network, A document management apparatus that manages to maintain identity with a plurality of document data stored in a predetermined storage area in the information processing apparatus,
Generate document digest data corresponding to the contents of each document data stored in the storage unit, and based on the plurality of document digest data generated from each of the plurality of document data stored in the storage unit, Integrated digest data generation means for generating composite digest data corresponding to the contents of the document digest data;
It is generated by the integrated digest data generation means whether there are different contents between the plurality of document data stored in the storage unit and the plurality of document data stored in the predetermined storage area. Data transmitting means for transmitting the combined digest data to the information processing apparatus to make a determination by comparing the combined digest data;
A document management apparatus comprising:
請求項5に記載の文書管理装置とネットワークを介してデータ通信可能に接続される情報処理装置であって、
所定の記憶領域に複数の文書データを記憶するデータ記憶手段と、
前記文書管理装置における所定の記憶部に記憶されている複数の文書データと、前記所定の記憶領域に記憶されている複数の文書データとで内容が異なるものが存在するか否かを、前記文書管理装置において生成された合成ダイジェストデータの比較により判定するデータ判別手段と、
を備えることを特徴とする情報処理装置。
An information processing apparatus connected to the document management apparatus according to claim 5 via a network so that data communication is possible,
Data storage means for storing a plurality of document data in a predetermined storage area;
Whether or not there is a document having different contents between a plurality of document data stored in a predetermined storage unit in the document management apparatus and a plurality of document data stored in the predetermined storage area. Data discriminating means for judging by comparing the composite digest data generated in the management device;
An information processing apparatus comprising:
情報処理装置と文書管理装置とがネットワークを介して相互にデータ通信可能に接続され、前記情報処理装置と前記文書管理装置とのそれぞれで保持される複数の文書データの同一性を保持するように管理する文書管理システムであって、
前記文書管理装置は、
所定の記憶部に複数の文書データを記憶する文書データ記憶手段と、
前記記憶部に記憶される各文書データの内容に対応した文書ダイジェストデータを生成し、前記記憶部に記憶される複数の文書データのそれぞれから生成した複数の文書ダイジェストデータに基づいて、前記複数の文書ダイジェストデータの内容に対応した合成ダイジェストデータを生成する統合ダイジェストデータ生成手段と、
を備え、
前記情報処理装置は、
所定の記憶領域に複数に文書データを記憶するデータ記憶手段を備え、
前記文書管理装置および前記情報処理装置の少なくとも一方は、
前記記憶部に記憶されている複数の文書データと、前記記憶領域に記憶されている複数の文書データとで内容が異なるものが存在するか否かを、前記統合ダイジェストデータ生成手段により生成される合成ダイジェストデータの比較により判定するデータ判別手段を備えることを特徴とする文書管理システム。
An information processing apparatus and a document management apparatus are connected to each other via a network so as to be able to perform data communication with each other, so that the identity of a plurality of document data held by the information processing apparatus and the document management apparatus is maintained. A document management system for managing
The document management apparatus includes:
Document data storage means for storing a plurality of document data in a predetermined storage unit;
Generate document digest data corresponding to the contents of each document data stored in the storage unit, and based on the plurality of document digest data generated from each of the plurality of document data stored in the storage unit, Integrated digest data generation means for generating composite digest data corresponding to the contents of the document digest data;
With
The information processing apparatus includes:
Data storage means for storing a plurality of document data in a predetermined storage area;
At least one of the document management device and the information processing device is:
The integrated digest data generation means generates whether or not there is a different content between the plurality of document data stored in the storage unit and the plurality of document data stored in the storage area. A document management system comprising data discriminating means for judging by comparing composite digest data.
所定の記憶部に複数の文書データを記憶する文書データ記憶手段を有する文書管理装置によって実行され、ネットワークを介して前記文書管理装置に接続された情報処理装置とデータ通信を行うことによって前記記憶部に記憶された複数の文書データと、前記情報処理装置における所定の記憶領域に記憶された複数の文書データとの同一性を保持するための文書管理プログラムであって、前記文書管理装置に、
前記記憶部に記憶された各文書データの内容に対応した文書ダイジェストデータを生成するステップと、
前記記憶部に記憶された複数の文書データのそれぞれから生成された複数の文書ダイジェストデータに基づいて、前記複数の文書ダイジェストデータの内容に対応した合成ダイジェストデータを生成するステップと、
前記記憶部に記憶されている複数の文書データと、前記所定の記憶領域に記憶されている複数の文書データとで内容が異なるものが存在するか否かを、前記合成ダイジェストデータの比較により判定するステップと、
を実行させることを特徴とする文書管理プログラム。
The storage unit is executed by a document management apparatus having a document data storage unit that stores a plurality of document data in a predetermined storage unit, and performs data communication with an information processing apparatus connected to the document management apparatus via a network. A document management program for maintaining the sameness between a plurality of document data stored in the information processing apparatus and a plurality of document data stored in a predetermined storage area in the information processing apparatus.
Generating document digest data corresponding to the contents of each document data stored in the storage unit;
Generating synthesized digest data corresponding to the contents of the plurality of document digest data based on a plurality of document digest data generated from each of the plurality of document data stored in the storage unit;
It is determined by comparing the composite digest data whether there are different contents between the plurality of document data stored in the storage unit and the plurality of document data stored in the predetermined storage area. And steps to
A document management program characterized by causing
所定の記憶部に複数の文書データを記憶する文書データ記憶手段を有する文書管理装置によって実行され、ネットワークを介して前記文書管理装置に接続された情報処理装置とデータ通信を行うことによって前記記憶部に記憶された複数の文書データと、前記情報処理装置における所定の記憶領域に記憶された複数の文書データとの同一性を保持するための文書管理プログラムであって、前記文書管理装置に、
前記記憶部に記憶された各文書データの内容に対応した文書ダイジェストデータを生成するステップと、
前記記憶部に記憶された複数の文書データのそれぞれから生成された複数の文書ダイジェストデータに基づいて、前記複数の文書ダイジェストデータの内容に対応した合成ダイジェストデータを生成するステップと、
前記記憶部に記憶されている複数の文書データと、前記所定の記憶領域に記憶されている複数の文書データとで内容が異なるものが存在するか否かを、前記合成ダイジェストデータの比較により判定させるために、前記情報処理装置に対して前記合成ダイジェストデータを送信するステップと、
を実行させることを特徴とする文書管理プログラム。
The storage unit is executed by a document management apparatus having a document data storage unit that stores a plurality of document data in a predetermined storage unit, and performs data communication with an information processing apparatus connected to the document management apparatus via a network. A document management program for maintaining the sameness between a plurality of document data stored in the information processing apparatus and a plurality of document data stored in a predetermined storage area in the information processing apparatus.
Generating document digest data corresponding to the contents of each document data stored in the storage unit;
Generating synthesized digest data corresponding to the contents of the plurality of document digest data based on a plurality of document digest data generated from each of the plurality of document data stored in the storage unit;
It is determined by comparing the composite digest data whether there are different contents between the plurality of document data stored in the storage unit and the plurality of document data stored in the predetermined storage area. To send the combined digest data to the information processing apparatus,
A document management program characterized by causing
JP2009223729A 2009-09-29 2009-09-29 Document management device, information processing apparatus, system and program for managing document Withdrawn JP2011076139A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009223729A JP2011076139A (en) 2009-09-29 2009-09-29 Document management device, information processing apparatus, system and program for managing document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009223729A JP2011076139A (en) 2009-09-29 2009-09-29 Document management device, information processing apparatus, system and program for managing document

Publications (1)

Publication Number Publication Date
JP2011076139A true JP2011076139A (en) 2011-04-14

Family

ID=44020099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009223729A Withdrawn JP2011076139A (en) 2009-09-29 2009-09-29 Document management device, information processing apparatus, system and program for managing document

Country Status (1)

Country Link
JP (1) JP2011076139A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017215637A (en) * 2016-05-30 2017-12-07 ローム株式会社 Data holding device and data holding system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017215637A (en) * 2016-05-30 2017-12-07 ローム株式会社 Data holding device and data holding system

Similar Documents

Publication Publication Date Title
EP4047487B1 (en) File storage method, terminal, and storage medium
EP3408744B1 (en) Providing access to a hybrid application offline
US9971823B2 (en) Dynamic replica failure detection and healing
US8078649B2 (en) Method and system for centrally deploying and managing virtual software applications
CN113261000B (en) Dynamic shared data object masking
US9298747B2 (en) Deployable, consistent, and extensible computing environment platform
US8407241B2 (en) Content mesh searching
US8620817B2 (en) Method and system for creating license management in software applications
US9195849B2 (en) Cloud application installed in client terminal connected to cloud server
US20180121672A1 (en) Restricting access to content
US10242100B2 (en) Managing cached data in a network environment
JP2004005491A (en) Pier-to-pier file sharing method and its device
WO2008097689A1 (en) Context sensitive caching on removable storage
US9875212B1 (en) Managing cached information corresponding to a distributed storage system
US20150113011A1 (en) File system directory attribute correction
US11620310B1 (en) Cross-organization and cross-cloud automated data pipelines
US8621182B1 (en) Management of object mapping information corresponding to a distributed storage system
US8316213B1 (en) Management of object mapping information corresponding to a distributed storage system
JP5911378B2 (en) Document management server, computer program, and document management method
US20020092012A1 (en) Smart-caching system and method
JP2011076139A (en) Document management device, information processing apparatus, system and program for managing document
US8521771B1 (en) Management of class-associated object mapping information corresponding to a distributed storage system
US20190155790A1 (en) Event-based synchronization in a file sharing environment
KR101345802B1 (en) System for processing rule data and method thereof
KR101319465B1 (en) File providing system for n-screen service

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20121204