JP5875535B2 - Anonymization device, anonymization method, program - Google Patents
Anonymization device, anonymization method, program Download PDFInfo
- Publication number
- JP5875535B2 JP5875535B2 JP2013007815A JP2013007815A JP5875535B2 JP 5875535 B2 JP5875535 B2 JP 5875535B2 JP 2013007815 A JP2013007815 A JP 2013007815A JP 2013007815 A JP2013007815 A JP 2013007815A JP 5875535 B2 JP5875535 B2 JP 5875535B2
- Authority
- JP
- Japan
- Prior art keywords
- anonymization
- attribute
- records
- value
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
本発明はデータベースにおける個別データのプライバシー情報を確率的手法により秘匿する匿名化装置、匿名化方法、プログラムに関する。 The present invention relates to an anonymization device, an anonymization method, and a program that conceal privacy information of individual data in a database by a probabilistic method.
近年、購買履歴や行動履歴等のデータを蓄積・分析し、商品のリコメンドやより良い都市開発等に活かしたいといった要望がある。しかし、このような個人に紐づくデータの利活用はプライバシーの問題があるため、第三者への提供や分析のアウトソーシング等が難しい。また、データを収集した者はそのデータについて繊細な取り扱いを要求されるといった問題がある。この問題に対し、データに適切なプライバシー保護措置を行うことでプライバシーの保護と統計分析を両立する匿名化技術が注目されている。匿名化技術では、データがどの程度プライバシーを保護できているかを定量的に表すため、幾つかのプライバシー指標が提案されている。その中でもk−匿名性、及びそれらを満たすアルゴリズムは近年最も研究が盛んな匿名化技術の一つである。しかし、k−匿名性及びその派生は確率的手法に適用できないという問題があったため、k−匿名性を確率空間へと拡張させたPk−匿名性と呼ばれるプライバシー保護指標が提案されている。 In recent years, there has been a desire to accumulate and analyze data such as purchase history and behavior history and utilize it for product recommendations and better urban development. However, utilization of data associated with such individuals has a privacy problem, and it is difficult to provide data to a third party or outsource analysis. In addition, there is a problem that a person who collects data is required to handle the data delicately. To deal with this problem, anonymization technology that achieves both privacy protection and statistical analysis by taking appropriate privacy protection measures for data has attracted attention. In the anonymization technique, several privacy indexes have been proposed to quantitatively represent how much data can protect privacy. Among them, k-anonymity and algorithms that satisfy them are one of the most anonymizing techniques that have been most studied in recent years. However, since there is a problem that k-anonymity and its derivation cannot be applied to a probabilistic method, a privacy protection index called Pk-anonymity that extends k-anonymity to a probability space has been proposed.
Pk−匿名性は、確率的手法のための、データベースにおける個別データのプライバシー情報がどの程度秘匿されているかを測る指標である。Pk−匿名性を満たす秘匿化技術として、非特許文献1、2、3、4が開示されている。 Pk-anonymity is an index for measuring how much privacy information of individual data in a database is concealed for a probabilistic method. Non-Patent Documents 1, 2, 3, and 4 are disclosed as concealment techniques that satisfy Pk-anonymity.
本発明では、提供者、処理者、分析者の3人が存在するモデルを考える。提供者は自身の個人に関する情報(以下、パーソナル情報)、を処理者に渡すものである。パーソナル情報として、例えばスマートフォンの位置情報などがある。処理者は複数の提供者のパーソナル情報を収集し、匿名化装置(匿名化方法)を用いて一括して匿名化処理を行い、分析者に提供する者である。分析者は、処理者から匿名化データを授受する者である。 In the present invention, a model in which there are three persons, a provider, a processor, and an analyst, is considered. The provider passes information related to the individual (hereinafter referred to as personal information) to the processor. Examples of personal information include smartphone location information. A processor is a person who collects personal information of a plurality of providers, performs anonymization processing in a batch using an anonymization device (anonymization method), and provides the analyst. An analyst is a person who gives and receives anonymized data from a processor.
プライバシー情報がどの程度秘匿されているかを表す指標として、前述したPk−匿名性があり、この指標を満たす手法をPk−匿名化と呼び、Pk−匿名化の具体的処理を匿名化処理と呼ぶこととする。Pk−匿名化は既に幾つか提案されているが、それらは全て匿名化対象のデータの分布によらず同一の処理を行う必要があった。本発明が適用されるモデルでは匿名化処理を一括で行うため、匿名化処理を行う際は元データ全体が既知である。そのため、匿名化処理をデータに依存させることでより良い匿名化が可能となる。例えば、元データがそもそもある程度の匿名性を持っているならば、匿名性が低いデータに比べ「弱い」匿名化処理を行う、といったことが考えられる。 There is Pk-anonymity described above as an index indicating how much privacy information is concealed. A method that satisfies this index is called Pk-anonymization, and a specific process of Pk-anonymization is called an anonymization process. I will do it. Several Pk-anonymizations have already been proposed, but all of them need to perform the same process regardless of the distribution of data to be anonymized. In the model to which the present invention is applied, since the anonymization process is performed in a lump, the entire original data is known when the anonymization process is performed. Therefore, a better anonymization becomes possible by making the anonymization process dependent on the data. For example, if the original data has some degree of anonymity in the first place, it can be considered that “weak” anonymization processing is performed as compared with data having low anonymity.
しかし既存のPk−匿名化はこのような元データの匿名性に依存した匿名化処理ができない。そのため、元データがそもそもある程度の匿名性を持っていた場合でも、元データの匿名性が低い場合と同一の処理を行う必要があり、結果として、得られる匿名化データの有用性が下がってしまうという課題がある。そこで本発明では、一括してデータに匿名化処理を施すとき、より弱い匿名化で所望する匿名性を満たすことができる匿名化装置を提供することを目的とする。 However, existing Pk-anonymization cannot perform such anonymization processing depending on the anonymity of the original data. Therefore, even if the original data has some degree of anonymity in the first place, it is necessary to perform the same processing as when the anonymity of the original data is low, and as a result, the usefulness of the obtained anonymized data is reduced. There is a problem. Therefore, an object of the present invention is to provide an anonymization device that can satisfy desired anonymity with weaker anonymization when performing anonymization processing on data collectively.
本発明の匿名化装置は、ソート部と、維持確率計算部と、行列計算部と、テーブル遷移部とを含む。 The anonymization device of the present invention includes a sorting unit, a maintenance probability calculation unit, a matrix calculation unit, and a table transition unit.
テーブルの各行を一個人のデータを表すレコードr、テーブルの各列を各属性の値とし、テーブルの属性の集合をAS、レコードrの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとし、匿名化される前の元テーブルをτ、匿名化テーブルをτ′とし、元テーブルのレコードr1、r2間の距離Dを、δ^をクロネッカーのデルタとしたとき、 Each row of the table is a record r representing one person's data, each column of the table is a value of each attribute, AS is a set of attributes of the table, R is a set of records r, and a set of values that a certain attribute a∈AS can take V a , its specific value v a , the original table before anonymization τ, the anonymization table τ ′, and the distance D between records r 1 and r 2 of the original table δ ^ Is the Kronecker delta,
と定義し、整数値を要素に持つ集合φに対するソート関数を、 And a sorting function for the set φ having integer values as elements,
と定義する。 It is defined as
ソート部は、元テーブルτから全てのレコードr∈Rについて The sorting unit performs the processing for all records rεR from the original table τ.
を計算し、 Calculate
を計算する。 Calculate
維持確率計算部は、匿名化パラメータk、niから Maintaining probability calculation unit anonymization parameter k, the n i
および、 and,
を満たすように、各属性の維持確率であるパラメータρajを求める。 The parameter ρaj , which is the maintenance probability of each attribute, is obtained so as to satisfy
行列計算部は、属性aの遷移確率行列 The matrix calculator is a transition probability matrix of attribute a
を計算する。 Calculate
テーブル遷移部は、テーブルの各属性の値を遷移確率行列を用いて遷移させる。 The table transition unit transitions the value of each attribute of the table using a transition probability matrix.
遷移とは、テーブルのあるレコードの属性aの値がvaであったとき、遷移確率行列に基づいて定まる確率でv′aに値を変更することを示す。 Transition, when the value of the attribute a of a table record was v a, indicating that changing the value to v 'a probability that is determined based on the transition probability matrix.
本発明の匿名化装置によれば、一括してデータに匿名化処理を施すとき、より弱い匿名化で所望する匿名性を満たすことができる。 According to the anonymization device of the present invention, when anonymization processing is performed on data collectively, anonymity desired by weaker anonymization can be satisfied.
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。 Hereinafter, embodiments of the present invention will be described in detail. In addition, the same number is attached | subjected to the structure part which has the same function, and duplication description is abbreviate | omitted.
<前提条件>
図1を参照して本発明の匿名化の対象について説明する。図1は本発明において匿名化の対象となるテーブルの例を示す図である。図1に示すように、本発明において匿名化に用いられるテーブルは、各行が一個人のデータを表し(これをレコードrと呼ぶ)、各列には各属性(例えば年齢、年収等)の値が入力されているものとする。本発明が満足するPk−匿名性というプライバシー保護指標は、プライバシーの保護度合をkというパラメータ(以下、匿名化パラメータと呼ぶ)で決めている。そのため、匿名化処理では最初にこの匿名化パラメータkが与えられるものとする。
<Prerequisites>
The anonymization target of the present invention will be described with reference to FIG. FIG. 1 is a diagram showing an example of a table to be anonymized in the present invention. As shown in FIG. 1, in the table used for anonymization in the present invention, each row represents one person's data (this is called a record r), and each column has a value of each attribute (for example, age, annual income, etc.). It is assumed that it has been entered. In the privacy protection index Pk-anonymity that the present invention satisfies, the degree of privacy protection is determined by a parameter k (hereinafter referred to as an anonymization parameter). Therefore, it is assumed that the anonymization parameter k is first given in the anonymization process.
図2を参照して本発明の匿名化装置の入出力について説明する。図2は本発明の匿名化装置の入出力の概要を示す図である。図2に示すように、匿名化装置は、匿名化の対象となる元テーブルと、どの程度匿名性を持たせるかを決めるパラメータ(匿名化パラメータk)とを入力とする。匿名化装置は匿名化処理を実行し、匿名化テーブルと、匿名化処理に用いたパラメータ(遷移確率行列など)が出力される。 The input / output of the anonymization device of the present invention will be described with reference to FIG. FIG. 2 is a diagram showing an outline of input / output of the anonymization device of the present invention. As shown in FIG. 2, the anonymization apparatus receives as input an original table to be anonymized and a parameter (anonymization parameter k) that determines how much anonymity is given. The anonymization device executes an anonymization process, and an anonymization table and parameters (such as a transition probability matrix) used for the anonymization process are output.
以下、本発明を詳細に記述するために、用語および関数の定義を行う。テーブルの属性の集合をAS、レコードrの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとする。匿名化される前の元テーブルをτ、匿名化テーブルをτ′とする。元テーブルのレコードr1、r2間の距離Dを以下のように定義する。δ^をクロネッカーのデルタとしたとき、 In the following, terms and functions are defined in order to describe the present invention in detail. Assume that a set of attributes of the table is AS, a set of records r is R, a set of values that a certain attribute aεAS can take is V a , and a specific value thereof is v a . Let the original table before anonymization be τ and the anonymization table be τ ′. The distance D between the records r 1 and r 2 of the original table is defined as follows. When δ ^ is the Kronecker delta,
と定義し、さらに整数値を要素に持つ集合φに対するソート関数を、 And a sorting function for the set φ having integer values as elements,
と定義する。 It is defined as
以下、図3、4を参照して、本発明の実施例1に係る匿名化装置1について説明する。図3は本実施例の匿名化装置1の構成を示すブロック図である。図4は本実施例の匿名化装置1の動作を示すフローチャートである。 Hereinafter, the anonymization device 1 according to the first embodiment of the present invention will be described with reference to FIGS. FIG. 3 is a block diagram showing the configuration of the anonymization device 1 of this embodiment. FIG. 4 is a flowchart showing the operation of the anonymization device 1 of this embodiment.
図3に示すように本実施例の匿名化装置1は、ソート部11と、維持確率計算部12と、行列計算部13と、テーブル遷移部14とを備える。匿名化装置1は、匿名化パラメータkと、元テーブルτを入力とする。まず、ソート部11は、元テーブルτから全てのレコードr∈Rについて As shown in FIG. 3, the anonymization device 1 of this embodiment includes a sorting unit 11, a maintenance probability calculation unit 12, a matrix calculation unit 13, and a table transition unit 14. The anonymization device 1 receives the anonymization parameter k and the original table τ. First, the sorting unit 11 performs the processing for all records rεR from the original table τ.
を計算し、 Calculate
を計算する(S11)。 Is calculated (S11).
ソート部11がおこなうソート、nの計算について図5、6を参照して補足説明する。図5は本実施例の匿名化装置1のソート部11が処理する元データの例を示す図である。図6は本実施例の匿名化装置1のソート部11の処理例を示す図である。図5に示すように属性を年齢、性別、年収とし、レコードr1、r2、r3、r4からなる元テーブルをソートする場合について考える。この場合図6に示すように、ソート部11は各レコード間の距離Dを計算し、当該距離Dをレコードごとに昇順に並べ替えるソートを実行し、並べ替え後の各順位の最大値からn=(n1,n2,n3)を計算する。 The sorting performed by the sorting unit 11 and the calculation of n will be supplementarily described with reference to FIGS. FIG. 5 is a diagram illustrating an example of original data processed by the sorting unit 11 of the anonymization device 1 according to the present embodiment. FIG. 6 is a diagram illustrating a processing example of the sorting unit 11 of the anonymization apparatus 1 according to the present embodiment. As shown in FIG. 5, let us consider a case where the attributes are age, gender, and annual income, and the original table composed of records r 1 , r 2 , r 3 , and r 4 is sorted. In this case, as shown in FIG. 6, the sorting unit 11 calculates the distance D between the records, executes sorting to sort the distance D in ascending order for each record, and calculates n from the maximum value of each rank after sorting. = (N 1 , n 2 , n 3 ) is calculated.
次に、維持確率計算部12は、与えられた匿名化パラメータkと先ほど求めたniから Then, maintaining the probability calculation section 12, the n i determined given anonymous parameters k and earlier
および、 and,
を満たすように、各属性の維持確率であるパラメータρajを求める(S12)。 A parameter ρaj , which is a maintenance probability of each attribute, is obtained so as to satisfy (S12).
次に、行列計算部13は、属性aの遷移確率行列 Next, the matrix calculation unit 13 uses the transition probability matrix of the attribute a
を計算する(S13)。次に、テーブル遷移部14は、テーブルの各属性の値を上の遷移確率行列を用いて遷移させる(S14)。遷移とは、テーブルのあるレコードの属性aの値がvaであったとき、確率 Is calculated (S13). Next, the table transition unit 14 causes the value of each attribute of the table to transition using the upper transition probability matrix (S14). Transition, when the value of the attribute a of a table record was v a, the probability
でv′aに値を変更することを意味する。この操作を全レコードの全属性値に行った結果を、匿名化テーブルτ′とする。 In v 'is meant to change the value to a. The result of performing this operation on all attribute values of all records is defined as an anonymization table τ ′.
匿名化装置1は、匿名化テーブルτ′、各属性の遷移確率行列{Aa|a∈AS}、 The anonymization device 1 includes an anonymization table τ ′, a transition probability matrix {A a | a∈AS} for each attribute,
を出力する。 Is output.
本実施例の匿名化装置1によれば、一括してデータに匿名化処理を施すとき、より弱い匿名化で所望する匿名性を満たすことができる。 According to the anonymization apparatus 1 of the present embodiment, when anonymization processing is performed on data collectively, anonymity desired by weaker anonymization can be satisfied.
また、本実施例の匿名化装置1によれば、従来の手法では存在しなかった元データのテーブルの情報n→が公開されるため、維持確率を大きくすることができる。維持確率は「データが遷移せずにそのままの値でいる確率」であり、高ければ高いほど元データに近いものになるため、従来の手法よりもデータの有用性が高い。 Further, according to the anonymization device 1 of the present embodiment, since the information n → of the original data table that did not exist in the conventional method is disclosed, the maintenance probability can be increased. The maintenance probability is the “probability that the data will remain as it is without transition”, and the higher the value, the closer to the original data, the more useful the data than the conventional method.
[変形例1]
以下、図7、図8を参照して、実施例1の一部を変形した変形例1の匿名化装置10について説明する。図7は本変形例の匿名化装置10の構成を示すブロック図である。図8は本変形例の匿名化装置10の動作を示すフローチャートである。
[Modification 1]
Hereinafter, with reference to FIG. 7 and FIG. 8, the anonymization apparatus 10 of the modification 1 which changed a part of Example 1 is demonstrated. FIG. 7 is a block diagram showing a configuration of the anonymization device 10 of the present modification. FIG. 8 is a flowchart showing the operation of the anonymization device 10 of this modification.
<前提条件>
実施例1と同様に、テーブルの各行を一個人のデータを表すレコードr、テーブルの各列を各属性の値とし、テーブルの属性の集合をAS、レコードrの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとする。また、Vを属性の組み合わせの集合、すなわちΠは直積を表すとしたとき、V=Πa∈ASVaであり、その要素をvとする。同様に、匿名化テーブルのある属性a∈ASがとりうる値の集合をV′a、その具体的な値をv′aとし、V′を匿名化テーブルの属性の組み合わせの集合とし、匿名化される前の元テーブルをτ、匿名化テーブルをτ′とする。
<Prerequisites>
As in the first embodiment, each row of the table is a record r representing one person's data, each column of the table is a value of each attribute, AS is a set of attributes of the table, R is a set of records r, and an attribute aε Assume that a set of values that AS can take is V a , and its specific value is v a . Further, when V is a set of attribute combinations, that is, 直 represents a direct product, V = Π aεAS V a and its element is v. Similarly, a set of values that an attribute aεAS of the anonymization table can take is V ′ a , a specific value is v ′ a, and V ′ is a set of combinations of attributes of the anonymization table, and anonymization is performed. Let τ be the original table before being processed, and τ ′ be the anonymization table.
図7に示すように、本変形例の匿名化装置10は、距離計算部110と、確率計算部120と、行列計算部130と、テーブル遷移部14とを備える。実施例1と同様に、本変形例の匿名化装置10は、匿名化パラメータkと、元テーブルτを入力とする。まず距離計算部110は、元テーブルτのすべてのレコードr∈Rについて、互いのレコード間距離Dを計算し、その中で最も大きいものをD*とする。ここで、テーブルの空間Tのうち、最も大きいレコード間距離がD*であるようなテーブルの集合をT^とする。また、匿名化テーブルの空間をT′とする。また、 As shown in FIG. 7, the anonymization device 10 of the present modification includes a distance calculation unit 110, a probability calculation unit 120, a matrix calculation unit 130, and a table transition unit 14. Similar to the first embodiment, the anonymization device 10 of the present modification takes the anonymization parameter k and the original table τ as inputs. First, the distance calculation unit 110 calculates the inter-record distance D for all the records rεR of the original table τ, and sets the largest one among them as D * . Here, a set of tables in which the largest inter-record distance is D * in the table space T is T ^. The space of the anonymization table is T ′. Also,
を「あるテーブルτ^のs番目のレコードの属性(これをτ^(s)と書く)」が、「匿名化テーブル τ′のs′番目のレコードの属性(これを τ′(s′)と書く)」に変化する確率をあらわすものと定義する。 Is the attribute of the sth record of a certain table τ ^ (this is written as τ ^ (s)), and the attribute of the s'th record of the anonymization table τ ′ (this is τ ′ (s ′) Is defined as the probability of changing.
次に、確率計算部120は、与えられた匿名性のパラメータkとT^、T′から、 Next, the probability calculation unit 120 calculates a given anonymity parameter k and T ^, T ′ from
を満たすような To meet
を計算する(S120)。ここで、πは任意のレコード順の置換である。 Is calculated (S120). Here, π is a replacement in an arbitrary record order.
次に、行列計算部130は、 Next, the matrix calculation unit 130
を満たし、かつ And satisfy
であるような|V|×|V′|行列Aを計算する(S130)。テーブル遷移部14は、ステップS130で求めた行列Aに従い元テーブルの各属性の値を遷移させる。具体的には、ステップS14は、元テーブルのレコードの属性がv∈Vであったとき、確率Av,v′でv′に値を変更する処理である。この処理を全レコードの全属性値に行った結果を、匿名化テーブル τ′とする。匿名化装置10は、匿名化テーブルτ′、遷移確率行列Aτ^,τ′,D*を出力する。 | V | × | V ′ | matrix A is calculated (S130). The table transition unit 14 transitions the value of each attribute of the original table according to the matrix A obtained in step S130. Specifically, step S14 is a process of changing the value to v ′ with the probability A v, v ′ when the attribute of the record in the original table is vεV. The result of performing this processing on all attribute values of all records is defined as an anonymization table τ ′. The anonymization device 10 outputs an anonymization table τ ′ and a transition probability matrix A τ ^, τ ′ , D * .
本変形例の匿名化装置10によれば、実施例1と同様、一括してデータに匿名化処理を施すとき、より弱い匿名化で所望する匿名性を満たすことができる。 According to the anonymization device 10 of the present modification, as in the first embodiment, when anonymization processing is performed on data collectively, anonymity desired by weaker anonymization can be satisfied.
また、本変形例においてレコード間距離Dをレコード同士のハミング距離として、クロネッカーのδ及びソート関数で計算したn→として具体化すれば、実施例1と同様に、従来の手法では存在しなかった元データのテーブルの情報n→が公開されるため、維持確率を大きくすることができる。維持確率は「データが遷移せずにそのままの値でいる確率」であり、高ければ高いほど元データに近いものになるため、従来の手法よりもデータの有用性が高い。 Further, in the present modification example, if the inter-record distance D is embodied as the Hamming distance between the records and n → calculated by the Kronecker δ and the sort function, as in the first embodiment, the conventional method does not exist. Since the information n → of the original data table is disclosed, the maintenance probability can be increased. The maintenance probability is the “probability that the data will remain as it is without transition”, and the higher the value, the closer to the original data, the more useful the data than the conventional method.
<前提条件>
実施例1と同様に、テーブルの属性の集合をAS、レコードの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとする。匿名化される前の元テーブルをτ、匿名化テーブルをτ′と書く。テーブルはレコードと属性値を結ぶ写像であり、例えばレコード1の属性値がAであれば、τ(1)=Aと表される。ここで、演算記号#τ(*)を
<Prerequisites>
As in the first embodiment, AS is a set of table attributes, R is a set of records, V a is a set of values that a certain attribute aεAS can take, and v a is a specific value thereof. The original table before anonymization is written as τ, and the anonymization table is written as τ ′. The table is a mapping connecting the record and the attribute value. For example, if the attribute value of the record 1 is A, τ (1) = A is expressed. Here, the operation symbol # τ (*)
と定義する。すなわち、#τ(v)とは、テーブルτのうち属性値がvであるレコードの数を表す。RL (k)、VL (k)をテーブルτにおいて#τ(τ(r))<kであるレコードrの集合、および属性τ(r)の集合とする。また、この方式は|RL (k)|≧kである必要がある。RL (k)、VL (k)について、図11の具体例を参照して補足説明する。図11は集合RL (k)、VL (k)を例示する図である。図11に示すような属性=年齢のレコードr1〜r10を例に、k=3の場合を考えると、集合RL (k)はk(=3)個未満の属性値と対応するレコード番号の集合である。従ってこの場合、集合RL (k)={4,5,6}となる。集合VL (k)は、k(=3)個未満の属性値の集合である。従ってこの場合、集合VL (k)={30代,40代}となる。 It is defined as That is, # τ (v) represents the number of records having the attribute value v in the table τ. Let R L (k) and V L (k) be a set of records r and a set of attributes τ (r) where # τ (τ (r)) <k in the table τ. In addition, this system needs to satisfy | R L (k) | ≧ k. R L (k) and V L (k) will be supplementarily described with reference to the specific example of FIG. FIG. 11 is a diagram illustrating the sets R L (k) and V L (k) . Assuming the case where k = 3, with the attributes r 1 to r 10 as shown in FIG. 11 as an example, the set R L (k) is a record corresponding to less than k (= 3) attribute values. A set of numbers. Therefore, in this case, the set R L (k) = {4, 5, 6}. The set V L (k) is a set of attribute values less than k (= 3). Therefore, in this case, the set V L (k) = {30s, 40s}.
以下、図9、図10を参照して実施例2の匿名化装置2について説明する。図9は本実施例の匿名化装置2の構成を示すブロック図である。図10は本実施例の匿名化装置2の動作を示すフローチャートである。図9に示すように、本実施例の匿名化装置2は、集合計算部21と、パラメータ計算部22と、行列計算部23と、テーブル遷移部14とを備える。実施例1と同様に、匿名化装置2は、匿名化パラメータkと、元テーブルτを入力とする。 Hereinafter, the anonymization device 2 according to the second embodiment will be described with reference to FIGS. 9 and 10. FIG. 9 is a block diagram showing the configuration of the anonymization device 2 of this embodiment. FIG. 10 is a flowchart showing the operation of the anonymization device 2 of this embodiment. As shown in FIG. 9, the anonymization device 2 of this embodiment includes a set calculation unit 21, a parameter calculation unit 22, a matrix calculation unit 23, and a table transition unit 14. Similar to the first embodiment, the anonymization device 2 receives the anonymization parameter k and the original table τ.
まず集合計算部21は、匿名化パラメータk、元テーブルτから集合RL (k)、VL (k)を計算し、|RL (k)|≧kならば、⊥(reject)を出力する(S21)。次に、パラメータ計算部22は、与えられた匿名化パラメータkとステップS21で求めたRL (k)から、 First, the set calculation unit 21 calculates the sets R L (k) and V L (k) from the anonymization parameter k and the original table τ. If | R L (k) | ≧ k, the set calculation unit 21 outputs ⊥ (reject). (S21). Next, the parameter calculation unit 22 uses the given anonymization parameter k and R L (k) obtained in step S21,
を満たすようなパラメータρ,c∈[0,1]を計算する(S22)。次に、行列計算部23は、ステップS22で求めたパラメータρ,cを用いて、遷移確率行列Aを
#τ(v)≧kのとき、
Parameters ρ, cε [0, 1] that satisfy the above are calculated (S22). Next, the matrix calculation unit 23 uses the parameters ρ and c obtained in step S22 to change the transition probability matrix A to # τ (v) ≧ k.
#τ(v)<kのとき、 When # τ (v) <k,
として計算する(S23)。次に、テーブル遷移部14は、遷移確率行列Aに従って、匿名化テーブル τ′を作成する(S14)。本実施例のテーブル遷移部14の動作は、実施例1のテーブル遷移部14の動作と同じである。 (S23). Next, the table transition unit 14 creates an anonymization table τ ′ according to the transition probability matrix A (S14). The operation of the table transition unit 14 of the present embodiment is the same as the operation of the table transition unit 14 of the first embodiment.
匿名化装置2は、匿名化テーブル τ′、および遷移確率行列Aを出力する。 The anonymization device 2 outputs the anonymization table τ ′ and the transition probability matrix A.
[変形例2]
以下、図12、図13を参照して、実施例2の一部を変形した変形例2の匿名化装置20について説明する。図12は本変形例の匿名化装置20の構成を示すブロック図である。図13は本変形例の匿名化装置20の動作を示すフローチャートである。なお、本変形例では、実施例2に示された<前提条件>を引き続き用いる。
[Modification 2]
Hereinafter, with reference to FIG. 12 and FIG. 13, an anonymization device 20 of Modification 2 in which a part of Embodiment 2 is modified will be described. FIG. 12 is a block diagram showing the configuration of the anonymization device 20 of this modification. FIG. 13 is a flowchart showing the operation of the anonymization device 20 of this modification. In this modification, the <precondition> shown in the second embodiment is continuously used.
図12に示すように、本変形例の匿名化装置20は、集合計算部21と、関数計算部220と、行列計算部230と、テーブル遷移部14とを備える。集合計算部21と、テーブル遷移部14の動作は、実施例2と共通しているので説明を割愛する。実施例2と同様に、匿名化装置20は、匿名化パラメータkと、元テーブルτを入力とする。 As illustrated in FIG. 12, the anonymization device 20 of the present modification includes a set calculation unit 21, a function calculation unit 220, a matrix calculation unit 230, and a table transition unit 14. Since the operations of the set calculation unit 21 and the table transition unit 14 are the same as those in the second embodiment, a description thereof will be omitted. Similar to the second embodiment, the anonymization device 20 receives the anonymization parameter k and the original table τ.
関数計算部220は、与えられた匿名化パラメータkとステップS21で求めたRL (k)から、 From the given anonymization parameter k and R L (k) obtained in step S21, the function calculator 220 calculates
を満たすような関数f∈[0,1],α∈[0,1],β∈[0,1]を計算する(S220)。次に、行列計算部230は、ステップS220で求めたf,α,βを用いて、|V|×|V′|行列Aを
#τ(v)≧kのとき、
A function fε [0,1], αε [0,1], βε [0,1] that satisfies the above is calculated (S220). Next, the matrix calculation unit 230 uses the f, α, and β obtained in step S220 to set | V | × | V ′ | matrix A to # τ (v) ≧ k.
#τ(v)<kのとき、任意の[0,1]に含まれる値、ただし When # τ (v) <k, the value included in any [0,1],
を満たすように計算する(S230)。 (S230).
以下、本変形例におけるステップS220、S230においてα、βをρを用いて、α=1+(1−ρ)/|V|,β=(1−ρ)/|V|として具体化した場合について述べる。この場合、上述したステップS220において、関数計算部220は、与えられた匿名化パラメータkとステップS21で求めたRL (k)から、 Hereinafter, in steps S220 and S230 in this modification, α and β are embodied as α = 1 + (1−ρ) / | V | and β = (1−ρ) / | V | using ρ as ρ. State. In this case, in step S220 described above, the function calculation unit 220 calculates from the given anonymization parameter k and R L (k) obtained in step S21.
を満たすような関数f∈[0,1],ρ[0,1]を計算する。次に、ステップS230において、行列計算部230は、ステップS220で求めたパラメータf,ρを用いて、|V|×|V′|行列Aを
#τ(v)≧kのとき、
A function fε [0,1], ρ [0,1] that satisfies the above is calculated. Next, in step S230, the matrix calculation unit 230 uses the parameters f and ρ obtained in step S220 and sets | V | × | V ′ | matrix A to # τ (v) ≧ k.
#τ(v)<kのとき、 When # τ (v) <k,
として計算する。 Calculate as
実施例2、および変形例2の匿名化装置2、20によれば、実施例1と同様に、一括してデータに匿名化処理を施すとき、より弱い匿名化で所望する匿名性を満たすことができる。 According to the anonymization devices 2 and 20 of the second embodiment and the second modification, as in the first embodiment, when anonymization processing is performed on data collectively, the desired anonymity is satisfied with weaker anonymization. Can do.
また、実施例2、および変形例2の匿名化装置2、20によれば、従来手法に存在しない集合RL (k)、VL (k)を用いることにより、集合RL (k)、VL (k)に依存してデータの処理を変えることができるため、従来手法と同等の匿名性を保ちながら、元データの変更を少なくすることができ、従来の手法よりもデータの有用性が高い。 In addition, according to the anonymization devices 2 and 20 of the second embodiment and the second modification, by using the sets R L (k) and V L (k) that do not exist in the conventional technique, the sets R L (k) , Since data processing can be changed depending on V L (k) , it is possible to reduce changes in the original data while maintaining anonymity equivalent to that of the conventional method, and the usefulness of the data compared to the conventional method. Is expensive.
<実施例1の匿名化装置1と実施例2の匿名化装置2の比較>
匿名化装置1の方式は、データ依存型維持置換撹乱方式と呼ぶべき性質を有している。匿名化装置1の方式では、テーブル全体の分布があまり保たれないが、その中の属性間の関係は保たれる。従って匿名化装置1の方式は、分析者が一つの大きな匿名化テーブルを取得し、その中の部分的な属性を使って分析する場合に有効な方式である。
<Comparison of Anonymization Device 1 of Example 1 and Anonymization Device 2 of Example 2>
The method of the anonymization device 1 has a property that should be called a data-dependent maintenance replacement disturbance method. In the method of the anonymization device 1, the distribution of the entire table is not maintained so much, but the relationship between the attributes in the table is maintained. Therefore, the method of the anonymization device 1 is an effective method when an analyst acquires one large anonymization table and analyzes using partial attributes therein.
一方、匿名化装置2の方式は、データ依存型クロス値撹乱方式と呼ぶべき性質を有している。匿名化装置2の方式では、テーブル全体の分布は保たれるが、個々の属性間の関係はあまり保たれない。従って匿名化装置2の方式は、分析者が分析の度にテーブルを取得するような場合、例えばオーダーメード匿名化に有効な方式である。 On the other hand, the method of the anonymization device 2 has a property that should be called a data-dependent cross-value disturbance method. In the method of the anonymizing device 2, the distribution of the entire table is maintained, but the relationship between individual attributes is not so much maintained. Therefore, the method of the anonymization device 2 is an effective method for custom-made anonymization, for example, when an analyst acquires a table for each analysis.
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。 The various processes described above are not only executed in time series according to the description, but may also be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes. Needless to say, other modifications are possible without departing from the spirit of the present invention.
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。 Further, when the above-described configuration is realized by a computer, processing contents of functions that each device should have are described by a program. The processing functions are realized on the computer by executing the program on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。 The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。 A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good.
なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer). In this embodiment, the present apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.
Claims (7)
カーのデルタとしたとき、
と定義し、整数値を要素に持つ集合φに対するソート関数を、
と定義し、
元テーブルτから全てのレコードr∈Rについて
を計算し、
を計算するソート部と、
匿名化パラメータk、niから
および、
を満たすように、各属性の維持確率であるパラメータρajを求める維持確率計算部と、
属性aの遷移確率行列
を計算する行列計算部と、
テーブルの各属性の値を遷移確率行列を用いて遷移させるテーブル遷移部とを含み、
遷移とは、テーブルのあるレコードの属性aの値がvaであったとき、遷移確率行列に基づいて定まる確率でv′aに値を変更することを示す
匿名化装置。 Each row of the table is a record r representing one person's data, each column of the table is a value of each attribute, AS is a set of attributes of the table, R is a set of records r, and a set of values that a certain attribute a∈AS can take V a , its specific value v a , the original table before anonymization τ, the anonymization table τ ′, and the distance D between records r 1 and r 2 of the original table δ ^ Is the Kronecker delta,
And a sorting function for the set φ having integer values as elements,
And define
For all records r∈R from the original table τ
Calculate
A sort part for calculating
Anonymous parameter k, from n i
and,
A maintenance probability calculation unit for obtaining a parameter ρ aj that is a maintenance probability of each attribute so as to satisfy
Transition probability matrix of attribute a
A matrix calculator for calculating
A table transition unit that transitions the value of each attribute of the table using a transition probability matrix,
Transition, when the value of the attribute a of a table record was v a, anonymous device indicating that change the value to v 'a probability that is determined based on the transition probability matrix.
元テーブルτのすべてのレコードr∈Rについて、互いのレコード間距離Dを計算し、その中で最も大きいものをD*とする距離計算部と、
テーブルの空間Tのうち、最も大きいレコード間距離がD*であるようなテーブルの集合をT^とし、匿名化テーブルの空間をT′とし、
を、あるテーブルτ^のs番目のレコードの属性τ^(s)が、匿名化テーブル τ′の
s′番目のレコードの属性τ′(s′)に変化する確率をあらわすものと定義し、πは任意のレコード順の置換であるものとし、
与えられた匿名性のパラメータkとT^、T′から、
を満たすような
を計算する確率計算部と、
を満たし、かつ
であるような|V|×|V′|行列Aを計算する行列計算部と、
テーブルの各属性の値を|V|×|V′|行列Aを用いて遷移させるテーブル遷移部とを含み、
遷移とは、テーブルのあるレコードの属性がv∈Vであったとき、遷移確率行列に基づいて定まる確率でv′に値を変更することを示す
匿名化装置。 Each row of the table is a record r representing one person's data, each column of the table is a value of each attribute, AS is a set of attributes of the table, R is a set of records r, and a set of values that a certain attribute a∈AS can take Is V a , its specific value is v a, and V is a set of attribute combinations, that is, Π represents a Cartesian product, V = A a∈AS V a , its element is v, and anonymization A set of values that a table attribute aεAS can take is V ′ a , its specific value is v ′ a, and V ′ is a set of combinations of attributes of the anonymization table. When the table is τ and the anonymization table is τ ′,
A distance calculation unit that calculates a distance D between records for all records rεR of the original table τ, and sets the largest one among them as D * ;
Of the table space T, let T ^ be the set of tables whose distance between records is D * , and let T 'be the anonymized table space.
Is defined as representing the probability that the attribute τ ^ (s) of the sth record of a table τ ^ will change to the attribute τ '(s') of the s'th record of the anonymization table τ', Let π be any record order permutation,
From given anonymity parameters k and T ^, T '
To meet
A probability calculation unit for calculating
And satisfy
A matrix calculator for calculating | V | × | V ′ | matrix A such that
A table transition unit that transitions the value of each attribute of the table using | V | × | V ′ | matrix A,
Transition is an anonymization device that indicates that when the attribute of a record in the table is vεV, the value is changed to v ′ with a probability determined based on the transition probability matrix.
レコード間距離Dをレコード同士のハミング距離とする
匿名化装置。 The anonymization device according to claim 2,
An anonymization device that uses a distance D between records as a Hamming distance between records.
テーブルの各行を一個人のデータを表すレコードr、テーブルの各列を各属性の値とし、テーブルの属性の集合をAS、レコードrの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとし、匿名化される前の元テーブルをτ、匿名化テーブルをτ′とし、元テーブルのレコードr1、r2間の距離Dを、δ^をクロネッカーのデルタとしたとき、
と定義し、整数値を要素に持つ集合φに対するソート関数を、
と定義し、
前記匿名化装置は、
元テーブルτから全てのレコードr∈Rについて
を計算し、
を計算するソートステップと、
匿名化パラメータk、niから
および、
を満たすように、各属性の維持確率であるパラメータρajを求める維持確率計算ステップと、
属性aの遷移確率行列
を計算する行列計算ステップと、
テーブルの各属性の値を遷移確率行列を用いて遷移させるテーブル遷移ステップとを実行し、
遷移とは、テーブルのあるレコードの属性aの値がvaであったとき、遷移確率行列に基づいて定まる確率でv′aに値を変更することを示す
匿名化方法。 An anonymization method executed by an anonymization device,
Each row of the table is a record r representing one person's data, each column of the table is a value of each attribute, AS is a set of attributes of the table, R is a set of records r, and a set of values that a certain attribute a∈AS can take V a , its specific value v a , the original table before anonymization τ, the anonymization table τ ′, and the distance D between records r 1 and r 2 of the original table δ ^ Is the Kronecker delta,
And a sorting function for the set φ having integer values as elements,
And define
The anonymization device
For all records r∈R from the original table τ
Calculate
A sorting step that calculates
Anonymous parameter k, from n i
and,
A maintenance probability calculation step for obtaining a parameter ρ aj that is a maintenance probability of each attribute so as to satisfy
Transition probability matrix of attribute a
A matrix calculation step for calculating
A table transition step for transitioning the values of the attributes of the table using the transition probability matrix ,
Transition is an anonymization method indicating that when a value of attribute a of a record in a table is va, the value is changed to va 'with a probability determined based on a transition probability matrix.
テーブルの各行を一個人のデータを表すレコードr、テーブルの各列を各属性の値とし、テーブルの属性の集合をAS、レコードrの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとし、Vを属性の組み合わせの集合、すなわちΠを直積を表すとしたとき、V=Πa∈ASVaとし、その要素をvとし、匿名化テーブルのある属性a∈ASがとりうる値の集合をV′a、その具体的な値をv′aとし、V′を匿名化テーブルの属性の組み合わせの集合とし、匿名化される前の元テーブルをτ、匿名化テーブルをτ′としたとき、
前記匿名化装置は、
元テーブルτのすべてのレコードr∈Rについて、互いのレコード間距離Dを計算し、その中で最も大きいものをD*とする距離計算ステップと、
テーブルの空間Tのうち、最も大きいレコード間距離がD*であるようなテーブルの集合をT^とし、匿名化テーブルの空間をT′とし、
を、あるテーブルτ^のs番目のレコードの属性τ^(s)が、匿名化テーブル τ′のs′番目のレコードの属性τ′(s′)に変化する確率をあらわすものと定義し、πは任意のレコード順の置換であるものとし、
与えられた匿名性のパラメータkとT^、T′から、
を満たすような
を計算する確率計算ステップと、
を満たし、かつ
であるような|V|×|V′|行列Aを計算する行列計算ステップと、
テーブルの各属性の値を|V|×|V′|行列Aを用いて遷移させるテーブル遷移ステップとを実行し、
遷移とは、テーブルのあるレコードの属性がv∈Vであったとき、遷移確率行列に基づいて定まる確率でv′に値を変更することを示す
匿名化方法。 An anonymization method executed by an anonymization device,
Each row of the table is a record r representing one person's data, each column of the table is a value of each attribute, AS is a set of attributes of the table, R is a set of records r, and a set of values that a certain attribute a∈AS can take Is V a , its specific value is v a, and V is a set of attribute combinations, that is, Π represents a Cartesian product, V = A a∈AS V a , its element is v, and anonymization A set of values that a table attribute aεAS can take is V ′ a , its specific value is v ′ a, and V ′ is a set of combinations of attributes of the anonymization table. When the table is τ and the anonymization table is τ ′,
The anonymization device
A distance calculating step of calculating a distance D between the records for all records r∈R of the original table τ, and setting D * as the largest one among them,
Of the table space T, let T ^ be the set of tables whose distance between records is D * , and let T 'be the anonymized table space.
Is defined as representing the probability that the attribute τ ^ (s) of the sth record of a table τ ^ will change to the attribute τ '(s') of the s'th record of the anonymization table τ', Let π be any record order permutation,
From given anonymity parameters k and T ^, T '
To meet
A probability calculating step for calculating
And satisfy
A matrix calculation step of calculating | V | × | V ′ | matrix A such that
A table transition step of transitioning the value of each attribute of the table using | V | × | V ′ | matrix A ;
Transition is an anonymization method indicating that when the attribute of a record in the table is vεV, the value is changed to v ′ with a probability determined based on the transition probability matrix.
レコード間距離Dを
レコード同士のハミング距離とする
匿名化方法。 The anonymization method according to claim 5,
An anonymization method in which the inter-record distance D is a Hamming distance between records.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013007815A JP5875535B2 (en) | 2013-01-18 | 2013-01-18 | Anonymization device, anonymization method, program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013007815A JP5875535B2 (en) | 2013-01-18 | 2013-01-18 | Anonymization device, anonymization method, program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014137586A JP2014137586A (en) | 2014-07-28 |
JP5875535B2 true JP5875535B2 (en) | 2016-03-02 |
Family
ID=51415085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013007815A Active JP5875535B2 (en) | 2013-01-18 | 2013-01-18 | Anonymization device, anonymization method, program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5875535B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11163895B2 (en) | 2016-12-19 | 2021-11-02 | Mitsubishi Electric Corporation | Concealment device, data analysis device, and computer readable medium |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7724782B2 (en) * | 2007-03-20 | 2010-05-25 | George Mason Intellectual Properties, Inc. | Interval centroid based watermark |
JP5475608B2 (en) * | 2010-10-01 | 2014-04-16 | 日本電信電話株式会社 | Disturbing system, disturbing device, disturbing method and program |
-
2013
- 2013-01-18 JP JP2013007815A patent/JP5875535B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014137586A (en) | 2014-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ficek et al. | Differential privacy in health research: A scoping review | |
Gassebner et al. | When to expect a coup d’état? An extreme bounds analysis of coup determinants | |
US20150169895A1 (en) | Anonymization for data having a relational part and sequential part | |
US10503906B2 (en) | Determining a risk indicator based on classifying documents using a classifier | |
US10176340B2 (en) | Abstracted graphs from social relationship graph | |
US20170277907A1 (en) | Abstracted Graphs from Social Relationship Graph | |
Ghavami | Big data management: Data governance principles for big data analytics | |
JP5782637B2 (en) | Attribute selection device, information anonymization device, attribute selection method, information anonymization method, attribute selection program, and information anonymization program | |
US20190318813A1 (en) | Augmenting datasets using de-identified data | |
US11487901B2 (en) | Anonymizing relational and textual data | |
US20220019689A1 (en) | Privacy Preserving Server-Side Personalized Content Selection | |
US11093640B2 (en) | Augmenting datasets with selected de-identified data records | |
Bender et al. | Privacy and confidentiality | |
Fotache et al. | Framework for the Assessment of Data Masking Performance Penalties in SQL Database Servers. Case Study: Oracle | |
WO2014006851A1 (en) | Anonymization device, anonymization system, anonymization method, and program recording medium | |
US9959154B2 (en) | Identifying defunct nodes in data processing systems | |
US20220215931A1 (en) | Generating multi-dimensional recommendation data objects based on decentralized crowd sourcing | |
Kaisler et al. | Big data issues and challenges | |
JP5875535B2 (en) | Anonymization device, anonymization method, program | |
JP5875536B2 (en) | Anonymization device, anonymization method, program | |
US10282361B2 (en) | Transforming time series data points from concurrent processes | |
Ritchie et al. | Confidentiality and linked data | |
Jones et al. | Sequential autoencoders for feature engineering and pretraining in major depressive disorder risk prediction | |
US9286349B2 (en) | Dynamic search system | |
Alghamdi et al. | Big data for C4I systems: goals, applications, challenges and tools |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151110 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5875535 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |