JP4547300B2 - Common query graph pattern generation device, generation method, generation program, and common subgraph search device, search method, and search program using the same - Google Patents
Common query graph pattern generation device, generation method, generation program, and common subgraph search device, search method, and search program using the same Download PDFInfo
- Publication number
- JP4547300B2 JP4547300B2 JP2005136706A JP2005136706A JP4547300B2 JP 4547300 B2 JP4547300 B2 JP 4547300B2 JP 2005136706 A JP2005136706 A JP 2005136706A JP 2005136706 A JP2005136706 A JP 2005136706A JP 4547300 B2 JP4547300 B2 JP 4547300B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- common
- subgraph
- query graph
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、膨大なデータの中からユーザが必要とする情報を検索するために用いる共通クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた共通サブグラフ検索装置、検索方法、検索用プログラムに関する。 The present invention relates to a common query graph pattern generation device, a generation method, a generation program, and a common subgraph search device, a search method, and a search using the same, which are used for searching for information required by a user from an enormous amount of data. Related to the program.
近年、コンピュータネットワーク上には大量のデータが存在しており、ユーザはその中から所望のデータを検索することが困難になってきている。そのため、大量のデータから所望のデータを簡易に入手するための精度の高い検索技術が注目を集めている。 In recent years, a large amount of data exists on a computer network, and it has become difficult for a user to search for desired data. Therefore, a highly accurate search technique for easily obtaining desired data from a large amount of data has attracted attention.
このような精度の高い検索を行うために用いられる技術にセマンティックWebがある。このセマンティックWebは、Webサイト上にメタデータとしてセマンティクス(意味情報)を付与し、人の手を使わずにデータを機械的に処理できる空間を創出するものである。 The Semantic Web is a technique used to perform such a high-precision search. This Semantic Web adds semantics (semantic information) as metadata on a Web site and creates a space where data can be processed mechanically without using human hands.
このセマンティックWebを利用した技術が非特許文献1に記載されている。この文献には、セマンティックWebを利用し、メタデータの記述方法を定めたResource Description Framework(RDF)により表現されたグラフ構造のデータから、グラフパターンをクエリとしてマッチングさせて必要なデータを検索する技術が記載されている。またこの文献では、マッチした部分をサブグラフとして取得するための仕様が規定されている。
しかし、この非特許文献1に記載の技術では、グラフ構造を持つ大量のデータの中から所望のサブグラフを抽出する際、予め抽出したいサブグラフの構造が分かっていなければならなかった。これは、ユーザの検索履歴データやユーザプロファイルデータの情報があってもこれらの情報からクエリグラフパターンを作成する方法については明示されていないため、ユーザ自身がそのグラフパターンをクエリとして入力しなければならないからである。そのため、ユーザによって異なる興味や関心に応じてクエリグラフパターンを変更する場合も、ユーザ自身が変更するグラフパターンを直接指定しなければならず、手間がかかるという問題があった。 However, in the technique described in Non-Patent Document 1, when a desired subgraph is extracted from a large amount of data having a graph structure, the structure of the subgraph to be extracted must be known in advance. This is because it is not specified how to create a query graph pattern from user search history data and user profile data information, so the user must input the graph pattern as a query. Because it will not be. Therefore, even when the query graph pattern is changed according to different interests or interests depending on the user, the user himself / herself has to directly specify the graph pattern to be changed.
また、非特許文献2には、グラフ集合から頻出部分のサブグラフを検出するアルゴリズムが記載されている。しかしこの技術は、グラフ構造を持った膨大な情報の中から頻出のサブグラフ構造を検出することはできるが、その際ユーザの興味対象に関連づけられた構造に基づいて検出することはできない。 Non-Patent Document 2 describes an algorithm for detecting a subgraph of a frequent portion from a graph set. However, this technique can detect a frequent subgraph structure from an enormous amount of information having a graph structure, but cannot detect it based on the structure associated with the user's interest.
本発明は、上記事情に鑑みてなされたものであり、グラフ構造を持つ大量のデータの中からクエリグラフパターンが一致する情報を検索する際、ユーザにより入力された情報または予め設定された情報に関連し且つ共通の意味合いの構造を持つ情報を取得することができるクエリグラフパターンを自動的に生成できる共通クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた共通サブグラフ検索装置、検索方法、検索用プログラムを提供することを目的とする。 The present invention has been made in view of the above circumstances, and when searching for information matching a query graph pattern from a large amount of data having a graph structure, information input by a user or preset information is used. A common query graph pattern generation device, a generation method, a generation program, and a common subgraph search device using them, which can automatically generate a query graph pattern capable of acquiring information having a structure of related and common meanings, It is an object to provide a search method and a search program.
上記目的を達成するための本発明は、主語となるデータおよび目的語となるデータを値としたノードと、これらのノード間の関係である述語となるデータを示すプロパティとにより、グラフ構造で表現されたデータベースが格納されたグラフ構造データ格納装置に接続された共通クエリグラフパターン生成装置において、入力されたキーワードと、選択された概念情報とを取得する検索内容取得手段と、前記グラフ構造データ格納装置に格納されたデータベース内から、前記キーワードを値とするノードにつながるプロパティと前記選択された概念情報とそれにつながるプロパティとを固定し、前記キーワードに該当するノードを任意の値にするとともに、前記固定された2つのプロパティの間のパスに含まれるノードの値およびプロパティを任意のデータとした検索クエリグラフパターンを生成する検索クエリグラフパターン生成手段と、前記検索クエリグラフパターン生成手段で生成された検索クエリグラフパターンの構造にマッチする部分の情報を、前記グラフ構造データ格納装置に格納されたデータベースの中から取得する検索サブグラフ取得手段と、前記検索サブグラフ取得手段で取得された検索サブグラフのうち、前記任意の値にしたキーワードに該当するノードにマッチした値が同一の検索サブグラフの中に複数個存在する、パスの構造およびこのパスに含まれるプロパティが一致するグラフ構造部分の情報を部分検索サブグラフとして抽出する部分検索サブグラフ抽出手段と、前記部分検索サブグラフ抽出手段で抽出された部分検索サブグラフに含まれるノードを任意の値にすることで、前記入力されたキーワードおよび選択された概念情報に関連し共通のグラフ構造部分を有するデータを検索するための共通クエリグラフパターンを生成する共通クエリグラフパターン生成手段とを備えることを特徴とする。 In order to achieve the above object, the present invention is expressed in a graph structure by a node having data as a subject and data as an object as values, and a property indicating data as a predicate which is a relation between these nodes. In a common query graph pattern generation device connected to a graph structure data storage device in which a stored database is stored, search content acquisition means for acquiring an input keyword and selected concept information, and the graph structure data storage From the database stored in the device, the property connected to the node having the keyword as a value, the selected concept information and the property connected thereto are fixed, the node corresponding to the keyword is set to an arbitrary value, and Node values and properties in the path between two fixed properties Search query graph pattern generation means for generating a search query graph pattern as arbitrary data, and information on a portion matching the structure of the search query graph pattern generated by the search query graph pattern generation means is stored in the graph structure data A search subgraph acquisition unit that is acquired from a database stored in the device and a search that has the same value that matches a node corresponding to the keyword set to the arbitrary value among the search subgraphs acquired by the search subgraph acquisition unit A sub-search sub-graph extracting unit that extracts information on a graph structure portion that exists in a plurality of sub-graphs and that has a matching path structure and a property included in the path as a sub-search sub-graph, Nodes included in the partial search subgraph By the value of the intention, and a common query graph pattern generating means for generating a common query graph pattern for retrieving data having a common graph structure portion in relation to the input keyword and selection of concepts information It is characterized by providing.
また、前記共通クエリグラフパターン生成装置は、等価の意味ごとに言葉が分類されたデータであるオントロジデータが格納されたオントロジデータ格納装置にさらに接続され、前記部分検索サブグラフ抽出手段は、前記部分検索サブグラフを抽出する際に、前記オントロジデータ格納装置に格納されたオントロジデータを用いて、等価の意味として分類されている言葉に対応する複数のプロパティを、同一のプロパティとして抽出するようにしてもよい。 The common query graph pattern generation device is further connected to an ontology data storage device in which ontology data, which is data in which words are classified for each equivalent meaning, is stored, and the partial search subgraph extraction means includes the partial search When extracting a subgraph, a plurality of properties corresponding to words classified as equivalent meanings may be extracted as the same property using ontology data stored in the ontology data storage device. .
また、前記共通クエリグラフパターン生成手段は、生成した共通クエリグラフパターンの中の、前記任意の値にしたキーワードに該当するノードの値として、前記検索内容取得手段で取得されたキーワードを代入した共通クエリグラフパターンを生成するようにしてもよい。 Further, the common query graph pattern generation means substitutes the keyword acquired by the search content acquisition means as the value of the node corresponding to the keyword set to the arbitrary value in the generated common query graph pattern. A query graph pattern may be generated .
また、この共通クエリグラフパターンにより前記グラフ構造データ格納装置に格納されたデータベースの中から取得された、検索内容の情報として入力されたキーワードおよび予め設定された中から選択された属性情報に関連する情報に共通のデータである共通サブグラフを、前記共通クエリグラフパターンの構造にマッチした情報ごとに、各ノードの値および各プロパティで示されるデータを表形式で表示させるためのデータに変換する表示データ変換手段をさらに備えるようにしてもよい。 Further, the common query graph pattern is related to the keyword input as the search content information and the attribute information selected from the preset information acquired from the database stored in the graph structure data storage device. Display data that converts a common subgraph, which is data common to information, into data for displaying the values of each node and the data indicated by each property in a tabular format for each piece of information that matches the structure of the common query graph pattern You may make it further provide a conversion means .
本発明によれば、グラフ構造を持つ大量のデータの中からクエリグラフパターンが一致する情報を検索する際に、ユーザによりキーワードまたは概念などの情報が入力されることにより、これらの情報に関連し且つ共通の意味合いの構造を持つ情報を取得することができるクエリグラフパターンを自動的に生成することができるため、所望の情報を効率よく取得することができる。 According to the present invention, when searching for information having a matching query graph pattern from a large amount of data having a graph structure, information such as a keyword or a concept is input by the user, and the information is related to the information. In addition, since a query graph pattern that can acquire information having a structure with a common meaning can be automatically generated, desired information can be efficiently acquired.
本発明の共通クエリグラフパターン生成装置の一実施形態を、図1〜図19を用いて説明する。 An embodiment of the common query graph pattern generation apparatus of the present invention will be described with reference to FIGS.
《一実施形態による検索システム1の構成》
図1は、本発明の一実施形態による共通クエリグラフパターン生成装置としての共通クエリグラフ生成部13を有する検索装置10を用いた検索システム1の構成を示す全体図である。
<< Configuration of Search System 1 According to One Embodiment >>
FIG. 1 is an overall view showing a configuration of a search system 1 using a
本実施形態における検索システム1は、検索装置10と、ユーザ端末20と、グラフ構造データベース30と、オントロジデータベース40とを有する。
The search system 1 in the present embodiment includes a
検索装置10は、ユーザ端末20、グラフ構造データベース30、およびオントロジデータベース40にアクセス可能な状態で接続されている。
The
また、検索装置10は、ユーザに検索内容の情報を入力させるための入力用GUIを生成する入力用GUI生成部11と、この入力用GUIに入力された情報に基づいて共通クエリグラフパターンを生成してこの共通クエリグラフパターンにマッチする情報をグラフ構造データベースから取得する共通クエリグラフパターン生成部12と、生成された共通クエリグラフパターンを蓄積する共通クエリグラフパターン蓄積部13と、ユーザに検索結果を提示するための出力用GUIを生成する出力用GUI生成部14とを有する。
In addition, the
グラフ構造データベース30は、図2に示すようなグラフ構造を持つデータが格納されている。本実施形態におけるグラフ構造データはラベル付き有向グラフデータであり、データのアーク(ノード間を結ぶ矢印)をRDFの仕様に基づいてプロパティと称する。
The
図3は、これらのグラフ構造データがどのように既存のリレーショナルデータベースなどで管理されているデータから生成され、グラフ化されているかを示す説明図である。図3は図2のデータの一部を示したものであり、ドキュメント「T-041」とそのドキュメントの著者「山田太郎」と、そのドキュメントの題名「セマンティックWeb入門」と、そのドキュメントのキーワード「セマンティックWeb」とが与えられているデータを、XML形式およびグラフ形式を用いてRDFで表現したものである。 FIG. 3 is an explanatory diagram showing how these graph structure data are generated from data managed in an existing relational database and are graphed. FIG. 3 shows a part of the data shown in FIG. 2. The document “T-041”, the author “Taro Yamada” of the document, the title of the document “Introduction to Semantic Web”, and the keyword “ Data given "Semantic Web" is expressed in RDF using XML format and graph format.
オントロジデータベース40は、図4に示すようなWeb Ontology Language(OWL)を用いて表現される、言葉の意味や分類体系を定義するためのオントロジデータが格納されている。図4では、プロパティ「rm:キーワード」とプロパティ「ms:用語」とは等価であり、プロパティ「rm:著者」とプロパティ「ms:著者」とは等価であることが示されている。
The
《一実施形態による検索システム1の動作》
次に、上記のように構成された検索システム1の動作を、図5のシーケンス図を用いて説明する。
<< Operation of Search System 1 According to One Embodiment >>
Next, the operation of the search system 1 configured as described above will be described with reference to the sequence diagram of FIG.
まず、入力用GUI生成部11において入力用GUIが生成される(S1)。本実施形態において生成される入力用GUIには、図6に示すように、キーワードを入力するスペースと、概念(クラス)を選択する欄が設けられている。
First, the input
そして、生成された入力用GUIがユーザ端末20に表示され、ユーザによりキーワードの入力および概念が選択される(S2)。本実施形態においては、ユーザによりキーワードとして「セマンティックWeb」が入力され、概念(クラス)として「人」が選択されている。入力されたキーワードおよび選択された概念のデータは共通クエリグラフパターン生成部12に出力される。
Then, the generated input GUI is displayed on the
共通クエリグラフパターン生成部12では、取得したキーワードを基にグラフ構造データベース30にアクセスが行われる(S3)。
In the common query graph
そして、グラフ構造データベース30において、このキーワード「セマンティックWeb」につながるプロパティが抽出される(S4)。抽出されたプロパティのアークが太線で示され、プロパティ名に下線が引かれたグラフ構造データの例を図7に示す。 Then, a property connected to the keyword “Semantic Web” is extracted from the graph structure database 30 (S4). FIG. 7 shows an example of the graph structure data in which the extracted property arc is indicated by a bold line and the property name is underlined.
さらにグラフ構造データベース30において、これらの太線で示されたプロパティ「rm:キーワード」または「ms:用語」を基に、このプロパティ「rm:キーワード」または「ms:用語」と、ユーザにより選択されたクラス「Person:人」のインスタンス「Person:山田太郎」、「Person:田中一郎」、または「Person:鈴木花子」との間にあるパスをグラフ構造データベース30から抽出することが可能な検索クエリグラフパターンが全て生成される(S5)。
Further, in the
図8は、生成された検索クエリグラフパターンを示す説明図である。本実施形態においては図8に示すように、ステップS4で抽出されたプロパティ「rm:キーワード」または「ms:用語」と、ユーザにより選択されたクラス「Person:人」と、このクラス「Person:人」のインスタンス「Person:山田太郎」、「Person:田中一郎」、または「Person:鈴木花子」からクラス「Person:人」につながるプロパティ「rdf:type」とが固定された2種類の検索クエリグラフパターンが生成されている。図8において、名称の先頭に「?」マークが記載されているノードは、任意の値が入る可能性がある変数であることを示している。 FIG. 8 is an explanatory diagram showing the generated search query graph pattern. In this embodiment, as shown in FIG. 8, the property “rm: keyword” or “ms: term” extracted in step S4, the class “Person: person” selected by the user, and the class “Person: Two types of search queries with fixed property "rdf: type" from "Person: Taro Yamada", "Person: Ichiro Tanaka", or "Person: Hanako Suzuki" to class "Person: Person" A graph pattern has been generated. In FIG. 8, a node having a “?” Mark at the beginning of the name indicates a variable that may have an arbitrary value.
次に、生成された2種類の検索クエリグラフパターンを基に、共通クエリグラフパターン生成部12からグラフ構造データベース30にアクセスされる(S6)。
Next, the common query graph
そして、グラフ構造データベース30においてこの検索クエリグラフパターンにマッチする検索サブグラフ(変数ノード「?keyword」と変数ノード「?Person」との間にパスが存在するサブグラフ)が抽出される(S7)。 Then, a search subgraph (subgraph having a path between the variable node “? Keyword” and the variable node “? Person”) that matches the search query graph pattern is extracted in the graph structure database 30 (S7).
図9は、グラフ構造データベース30から抽出された検索サブグラフの一例である第1検索サブグラフを示す説明図である。この第1検索サブグラフでは、変数ノード「?keyword」としてノード「XML」がマッチした検索サブグラフを示す。このとき、変数ノード「?Person」の値が同一のデータについては同一ノードを1つのみ表示するようにする。
FIG. 9 is an explanatory diagram showing a first search subgraph that is an example of a search subgraph extracted from the
このように、変数ノード「?keyword」がノード「XML」であり同一の変数ノード「?Person」ごとに示された第1検索サブグラフは、図9に示すとおり(1)変数ノード「?Person」がノード「Person:山田太郎」の場合、(2)変数ノード「?Person」がノード「Person:鈴木花子」の場合、(3)変数ノード「?Person」がノード「Person:中村二郎」の場合の3種類である。 Thus, the variable node “? Keyword” is the node “XML”, and the first search subgraph shown for each identical variable node “? Person” is (1) variable node “? Person” as shown in FIG. Is the node “Person: Taro Yamada”, (2) the variable node “? Person” is the node “Person: Hanako Suzuki”, (3) the variable node “? Person” is the node “Person: Jiro Nakamura” There are three types.
次に、これら3種類の第1検索サブグラフの中から、2点(ノード「XML」および変数ノード「?Person」)のノード間が2個以上の複数のパスで構成され、この複数のパスで構成されたグラフの構造およびこのパスのプロパティが一致し、且つこの一致した複数のパスで構成されたグラフの構造およびこのパスのプロパティが複数の検索結果の中に存在する部分第1検索サブグラフが抽出される(S8)。 Next, among these three types of first search subgraphs, two nodes (node “XML” and variable node “? Person”) are composed of two or more paths. A partial first search sub-graph in which the structure of the constructed graph and the property of the path match, and the structure of the graph constructed by the matched plurality of paths and the property of the path exist in the plurality of search results Extracted (S8).
図10は、第1検索サブグラフから抽出された部分第1検索サブグラフのプロパティを太線で示した状態を示す説明図である。本実施形態においては、ノード「XML」に2本のプロパティ「rm:キーワード」がつながり、変数ノード「?Person」にプロパティ「pj:担当者」とプロパティ「rm:著者」とがつながっている構造の部分検索サブグラフが抽出されている。 FIG. 10 is an explanatory diagram illustrating a state in which the properties of the partial first search subgraph extracted from the first search subgraph are indicated by bold lines. In the present embodiment, two properties “rm: keyword” are connected to the node “XML”, and the property “pj: person” and the property “rm: author” are connected to the variable node “? Person”. The partial search subgraph is extracted.
そして、この部分第1検索サブグラフにおいて、共通した構造およびプロパティ以外のノード「XML」、「Aプロジェクト」、「rm:T-041」、「Bプロジェクト」、「rm:T-057」、「Person:山田太郎」、および「Person:鈴木花子」を変数ノードとした第1共通クエリグラフパターンが共通クエリグラフパターン生成部12において生成される(S9)。
In this partial first search subgraph, nodes other than the common structure and properties "XML", "A project", "rm: T-041", "B project", "rm: T-057", "Person The common query graph
生成された第1共通クエリグラフパターンは、共通クエリグラフパターン生成部12から共通クエリグラフパターン蓄積部13に送出され蓄積される(S10)。
The generated first common query graph pattern is transmitted from the common query graph
図11は、生成された第1共通クエリグラフパターンを示す説明図である。本実施形態においては図11に示すように、ステップS8で抽出されたプロパティ「rm:キーワード」、「pj:担当者」、および「tm:著者」が固定された第1共通クエリグラフパターンが生成されている。 FIG. 11 is an explanatory diagram showing the generated first common query graph pattern. In the present embodiment, as shown in FIG. 11, the first common query graph pattern in which the properties “rm: keyword”, “pj: person”, and “tm: author” extracted in step S8 are fixed is generated. Has been.
一方、ステップS7において、変数ノード「?keyword」としてノード「セマンティックWeb」がマッチした第2検索サブグラフについて説明する。 On the other hand, the second search subgraph in which the node “Semantic Web” is matched as the variable node “? Keyword” in step S7 will be described.
図12は、変数ノード「?keyword」としてノード「セマンティックWeb」がマッチした第2検索サブグラフを示す説明図である。ここでも、変数ノード「?Person」の値が同一のデータについては同一ノードを1つのみ表示するようにする。 FIG. 12 is an explanatory diagram showing a second search subgraph in which the node “Semantic Web” is matched as the variable node “? Keyword”. Again, for data with the same variable node “? Person” value, only one identical node is displayed.
このように、変数ノード「?keyword」がノード「セマンティックWeb」であり同一の変数ノード「?Person」ごとに示された第2検索サブグラフは、図12に示すとおり(1)変数ノード「?Person」がノード「Person:山田太郎」の場合、(2)変数ノード「?Person」がノード「Person:田中一郎」の場合、(3)変数ノード「?Person」がノード「Person: 鈴木花子」の場合の3種類である。 Thus, the second search subgraph shown for each variable node “? Person” with the variable node “? Keyword” being the node “Semantic Web” is as shown in FIG. ”Is the node“ Person: Taro Yamada ”, (2) the variable node“? Person ”is the node“ Person: Ichiro Tanaka ”, (3) the variable node“? Person ”is the node“ Person: Hanako Suzuki ” There are three types of cases.
次に、この第2検索サブグラフに含まれるプロパティを基に、共通クエリグラフパターン生成部12からオントロジデータベース40にアクセスされる(S11)。
Next, the
そして、オントロジデータベース40において、これらの第2検索サブグラフに含まれるプロパティの中に同じ意味に分類されているものがあるかどうか検索される。ここでは、第2検索サブグラフのプロパティに含まれ、同じ意味に分類されている「キーワード」と「用語」とが抽出され、共通クエリグラフパターン生成部12に送出される(S12)。
Then, the
次に、3種類の第2検索サブグラフの中から、2点(ノード「セマンティックWeb」および変数ノード「?Person」)のノード間が2個以上の複数のパスで構成され、この複数のパスで構成されたグラフの構造およびこのパスのプロパティが一致し、且つこの一致した複数のパスで構成されたグラフの構造およびこのパスのプロパティが複数の検索結果の中に存在する部分第2検索サブグラフが抽出される。このとき、ステップS14で抽出された単語は同一とみなされ、部分第2検索サブグラフが抽出される(S8)。 Next, two points (node “Semantic Web” and variable node “? Person”) are composed of two or more paths from the three types of second search subgraphs. A partial second search subgraph in which the structure of the constructed graph and the property of this path match, and the structure of the graph composed of the matched plurality of paths and the property of this path exist in the plurality of search results Extracted. At this time, the words extracted in step S14 are regarded as the same, and the partial second search subgraph is extracted (S8).
図13は、第2検索サブグラフから抽出された部分第2検索サブグラフのプロパティを太線で示した状態を示す説明図である。本実施形態においては、ノード「セマンティックWeb」に2本のプロパティ「rm:キーワード」または「ms:用語」がつながり、変数ノード「?Person」にプロパティ「rm:著者」またはプロパティ「ms:著者」とがつながっている構造の部分第2検索サブグラフが抽出されている。 FIG. 13 is an explanatory diagram showing a state in which the properties of the partial second search subgraph extracted from the second search subgraph are indicated by bold lines. In this embodiment, two properties “rm: keyword” or “ms: term” are connected to the node “Semantic Web”, and the property “rm: author” or the property “ms: author” is connected to the variable node “? Person”. A partial second search subgraph having a structure connected to is extracted.
そして、この部分第2検索サブグラフにおいて、共通した構造およびプロパティ以外のノード「セマンティックWeb」、「rm:T-041」、「ms:PF1-14」、「rm:T-053」、「rm:T-048」「Person:山田太郎」、および「Person:田中一郎」を変数ノードとした第2共通クエリグラフパターンが共通クエリグラフパターン生成部12において生成される(S9)。 In this partial second search subgraph, nodes “semantic web”, “rm: T-041”, “ms: PF1-14”, “rm: T-053”, “rm: A second common query graph pattern having variable nodes “T-048”, “Person: Taro Yamada”, and “Person: Ichiro Tanaka” is generated in the common query graph pattern generation unit 12 (S9).
生成された第2共通クエリグラフパターンも、共通クエリグラフパターン生成部12から共通クエリグラフパターン蓄積部13に送出され蓄積される(S10)。
The generated second common query graph pattern is also transmitted from the common query graph
図14は、生成された第2共通クエリグラフパターンを示す説明図である。本実施形態においては図14に示すように、ステップS8で抽出されたプロパティ「rm:キーワード」、「rm:キーワード」もしくは「ms:用語」、「rm:著者」、「rm:著者」もしくは「ms:著者」が固定された第2共通クエリグラフパターンが生成されている。 FIG. 14 is an explanatory diagram showing the generated second common query graph pattern. In this embodiment, as shown in FIG. 14, the properties “rm: keyword”, “rm: keyword” or “ms: term”, “rm: author”, “rm: author” or “ A second common query graph pattern in which “ms: author” is fixed is generated.
次に、図15に示すように、ステップS9で生成された第1クエリグラフパターンの変数ノード「?keyword」にユーザにより入力されたキーワード「セマンティックWeb」を代入し、この第1クエリグラフパターンを基に、共通クエリグラフパターン生成部12からグラフ構造データベース30にアクセスされる(S13)。
Next, as shown in FIG. 15, the keyword “Semantic Web” input by the user is substituted into the variable node “? Keyword” of the first query graph pattern generated in step S9, and this first query graph pattern is substituted. Based on this, the common query graph
そして、グラフ構造データベース30においてこのキーワード「セマンティックWeb」が代入された第1クエリグラフパターンにマッチする第1共通サブグラフが抽出される(S14)。
Then, a first common subgraph that matches the first query graph pattern in which the keyword “Semantic Web” is substituted in the
図16は、グラフ構造データベース30から抽出された第1共通サブグラフを示す説明図である。本実施形態においては抽出された第1共通サブグラフは1件のみであり、これはユーザにより入力されたキーワード「セマンティックWeb」以外の技術(ここでは「XML」)においてみられたクラス「人」とクラス「技術」との間に共通して存在する強い関連性のある情報が、キーワード「セマンティックWeb」に関しては1件しかなかったことを示している。
FIG. 16 is an explanatory diagram showing the first common sub-graph extracted from the
次に、図17に示すように、ステップS9で生成された第2クエリグラフパターンの変数ノード「?keyword」にユーザにより入力されたキーワード「セマンティックWeb」を代入し、この第2クエリグラフパターンを基に、共通クエリグラフパターン生成部12からグラフ構造データベース30にアクセスされる(S13)。
Next, as shown in FIG. 17, the keyword “Semantic Web” input by the user is substituted into the variable node “? Keyword” of the second query graph pattern generated in step S9, and this second query graph pattern is substituted. Based on this, the common query graph
そして、グラフ構造データベース30においてこのキーワード「セマンティックWeb」が代入された第2クエリグラフパターンにマッチする第2共通サブグラフが抽出される(S14)。
Then, a second common subgraph that matches the second query graph pattern in which the keyword “Semantic Web” is substituted in the
本実施形態においては抽出された第2共通サブグラフは2件であり、これはクラス「人」とクラス「技術」との間に共通して存在する強い関連性のある情報が、キーワード「セマンティックWeb」に関しては2件存在するとともに、この2件の中のノード「Person:」に示される「山田太郎」と「田中一郎」とは、キーワード「セマンティックWeb」に関して類似した情報を持つことを示している。 In this embodiment, there are two extracted second common subgraphs. This is because the strongly related information that exists between the class “person” and the class “technology” is the keyword “Semantic Web”. "Taro Yamada" and "Ichiro Tanaka" shown in the node "Person:" in these two cases have similar information regarding the keyword "Semantic Web" Yes.
抽出された2件の第2共通サブグラフは、共通クエリグラフパターン生成部12において、同一のノードを1つのノードとして表すように2つのグラフがマージされる(S15)。
The two extracted second common subgraphs are merged in the common query graph
図18は、2件の第2共通サブグラフがマージされた状態を示す説明図である。 FIG. 18 is an explanatory diagram showing a state where two second common subgraphs are merged.
さらに、このマージされた第2共通サブグラフは、出力用GUI生成部14において図19に示すような表形式の出力用GUIが生成され(S16)、ユーザ端末20において表示される(S17)。この際、グラフ構造データベースのデータよりドキュメントの題名がわかっているものについては併せて表示される。図19においては、ドキュメント「rm:T-041」とともにこのタイトル「セマンティックWeb入門」が表示されている。 Further, the merged second common subgraph is generated in a tabular output GUI as shown in FIG. 19 in the output GUI generation unit 14 (S16) and displayed on the user terminal 20 (S17). At this time, the document whose title is known from the data of the graph structure database is also displayed. In FIG. 19, the title “Introduction to Semantic Web” is displayed together with the document “rm: T-041”.
以上の実施形態によれば、グラフ構造を持つ大量のデータの中からクエリグラフパターンが一致する情報を検索する際に、ユーザにより入力されたキーワード「セマンティックWeb」および概念「人」に関連し意味的に共通の構造を持つ情報を自動的に取得し、ユーザに見やすい形式で提供することができる。 According to the above embodiment, when searching for information that matches the query graph pattern from a large amount of data having a graph structure, the meaning is related to the keyword “Semantic Web” and the concept “people” input by the user. In general, information having a common structure can be automatically acquired and provided in a format that is easy for the user to see.
また、ステップ11において共通クエリグラフパターンが蓄積されることにより、グラフ構造データベース30にデータが追加された際にも、蓄積されている共通クエリグラフパターンを基にグラフ構造データベース30を再度検索すれば追加されたデータも含まれた情報を取得することができる。
Further, when the common query graph pattern is accumulated in
本実施形態では、ステップS5において検索クエリグラフパターンを生成する際、2点のノード間のノードが1個の検索サブクエリを検索するための検索クエリグラフパターンを生成しているが、これには限定されず、2個以上のノードが存在する検索クエリグラフパターンを生成することも可能である。また、キーワードにつながるプロパティによって制約されるノードのみ、もしくはクラスによって制約されるノードのみで2点を構成して検索クエリグラフパターンを生成することも可能である。さらには、プロパティの矢印の向きに応じて複数の検索クエリグラフパターンを生成することも可能である。 In this embodiment, when a search query graph pattern is generated in step S5, a node between two nodes generates a search query graph pattern for searching for one search subquery. Alternatively, it is possible to generate a search query graph pattern in which two or more nodes exist. It is also possible to generate a search query graph pattern by configuring two points with only nodes restricted by properties connected to keywords or nodes restricted by classes. Furthermore, it is possible to generate a plurality of search query graph patterns according to the direction of the property arrow.
また、本実施形態では、ステップS8において部分第1検索サブグラフを抽出する際、2点のノード間が2個以上の複数のパスで構成されていることを条件としているが、これには限定されず、このパスの個数については可変とすることができる。その際、検索結果の中にどれだけの個数の同じ構造があれば抽出するかといった条件についても可変とすることができる。 Further, in the present embodiment, when extracting the partial first search subgraph in step S8, the condition is that the two nodes are composed of two or more paths, but the present invention is not limited to this. Instead, the number of paths can be made variable. At that time, it is possible to change the condition of how many identical structures are extracted in the search result.
また、本実施形態では、ステップS9において部分第1検索サブグラフに含まれるノードを変数にすることにより共通クエリグラフパターンを生成したが、この方法には限定されず、一部のプロパティ名を変数とした共通クエリグラフパターンを生成することも可能である。 In this embodiment, the common query graph pattern is generated by making the node included in the partial first search subgraph a variable in step S9. However, the present invention is not limited to this method. It is also possible to generate a common query graph pattern.
1…検索システム
10…検索装置
11…入力用GUI生成部
12…共通クエリグラフパターン生成部
13…共通クエリグラフパターン蓄積部
14…出力用GUI生成部
20…ユーザ端末
30…グラフ構造データベース
40…オントロジデータベース
DESCRIPTION OF SYMBOLS 1 ...
Claims (21)
入力されたキーワードと、選択された概念情報とを取得する検索内容取得手段と、
前記キーワードを値とするノードにつながるプロパティと前記選択された概念情報とそれにつながるプロパティとを固定し、前記キーワードに該当するノードの値を任意のデータにするとともに、前記固定された2つのプロパティの間のパスに含まれるノードの値およびプロパティを任意のデータとした検索クエリグラフパターンを生成する検索クエリグラフパターン生成手段と、
前記検索クエリグラフパターン生成手段で生成された検索クエリグラフパターンの構造にマッチする部分の情報を、前記グラフ構造データ格納装置に格納されたデータベースの中から取得する検索サブグラフ取得手段と、
前記検索サブグラフ取得手段で取得された検索サブグラフのうち、前記任意の値にしたキーワードに該当するノードにマッチした値が同一の検索サブグラフの中に複数個存在する、パスの構造およびこのパスに含まれるプロパティが一致するグラフ構造部分の情報を部分検索サブグラフとして抽出する部分検索サブグラフ抽出手段と、
前記部分検索サブグラフ抽出手段で抽出された部分検索サブグラフに含まれるノードを任意の値にすることで、前記入力されたキーワードおよび選択された概念情報に関連し共通のグラフ構造部分を有するデータを検索するための共通クエリグラフパターンを生成する共通クエリグラフパターン生成手段と
を備えることを特徴とする共通クエリグラフパターン生成装置。 Graph structure data storage in which a database expressed in a graph structure is stored with nodes that have subject data and object data as values, and properties that indicate predicate data that is the relationship between these nodes In the common query graph pattern generation device connected to the device,
Search content acquisition means for acquiring the input keyword and the selected concept information;
The property connected to the node having the keyword as a value, the selected concept information and the property connected thereto are fixed, the value of the node corresponding to the keyword is set as arbitrary data, and the two fixed properties A search query graph pattern generating means for generating a search query graph pattern using the values and properties of the nodes included in the path between them as arbitrary data;
Search subgraph acquisition means for acquiring information on a portion matching the structure of the search query graph pattern generated by the search query graph pattern generation means from a database stored in the graph structure data storage device;
Among the search subgraphs acquired by the search subgraph acquisition means, there are a plurality of values that match the node corresponding to the keyword set to the arbitrary value in the same search subgraph, and the path structure and this path include A partial search subgraph extracting means for extracting information of a graph structure portion having matching properties as a partial search subgraph;
The nodes included in the partial search subgraph extracted by the partial search subgraph extraction means are set to arbitrary values, thereby searching for data having a common graph structure portion related to the input keyword and the selected concept information. A common query graph pattern generation device, comprising: common query graph pattern generation means for generating a common query graph pattern for generating a common query graph pattern.
前記部分検索サブグラフ抽出手段は、前記部分検索サブグラフを抽出する際に、前記オントロジデータ格納装置に格納されたオントロジデータを用いて、等価の意味として分類されている言葉に対応する複数のプロパティを、同一のプロパティとして抽出する
ことを特徴とする請求項1に記載の共通クエリグラフパターン生成装置。 The common query graph pattern generation device is further connected to an ontology data storage device that stores ontology data that is data in which words are classified for each equivalent meaning,
The partial search subgraph extraction means uses the ontology data stored in the ontology data storage device to extract a plurality of properties corresponding to words classified as equivalent meanings when extracting the partial search subgraph. The common query graph pattern generation apparatus according to claim 1, wherein the common query graph pattern generation apparatus extracts the same property as the same property .
ことを特徴とする請求項1または2に記載の共通クエリグラフパターン生成装置。 The common query graph pattern generation unit substitutes the keyword acquired by the search content acquisition unit as the value of the node corresponding to the keyword set to the arbitrary value in the generated common query graph pattern. common query graph pattern generating apparatus according to claim 1 or 2, characterized in <br/> generating a pattern.
入力されたキーワードと、選択された概念情報とを取得する検索内容取得ステップと、
前記キーワードを値とするノードにつながるプロパティと前記選択された概念情報とそれにつながるプロパティとを固定し、前記キーワードに該当するノードを任意の値にするとともに、前記固定された2つのプロパティの間のパスに含まれるノードの値およびプロパティを任意のデータとした検索クエリグラフパターンを生成する検索クエリグラフパターン生成ステップと、
前記検索クエリグラフパターン生成ステップで生成された検索クエリグラフパターンの構造にマッチする部分の情報を、前記グラフ構造データ格納装置に格納されたデータベースの中から取得する検索サブグラフ取得ステップと、
前記検索サブグラフ取得ステップで取得された検索サブグラフのうち、前記任意の値にしたキーワードに該当するノードにマッチした値が同一の検索サブグラフの中に複数個存在する、パスの構造およびこのパスに含まれるプロパティが一致するグラフ構造部分の情報を部分検索サブグラフとして抽出する部分検索サブグラフ抽出ステップと、
前記部分検索サブグラフ抽出ステップで抽出された部分検索サブグラフに含まれるノードを任意の値にすることで、前記入力されたキーワードおよび選択された概念情報に関連し共通のグラフ構造部分を有するデータを検索するための共通クエリグラフパターンを生成する共通クエリグラフパターン生成ステップと
を有することを特徴とする共通クエリグラフパターン生成方法。 Graph structure data storage in which a database expressed in a graph structure is stored with nodes that have subject data and object data as values, and properties that indicate predicate data that is the relationship between these nodes A common query graph pattern generation device connected to the device
A search content acquisition step for acquiring the input keyword and the selected concept information;
The property connected to the node having the keyword as a value, the selected concept information and the property connected thereto are fixed, the node corresponding to the keyword is set to an arbitrary value, and between the two fixed properties A search query graph pattern generation step for generating a search query graph pattern using the values and properties of the nodes included in the path as arbitrary data;
A search subgraph acquisition step for acquiring information on a portion matching the structure of the search query graph pattern generated in the search query graph pattern generation step from a database stored in the graph structure data storage device;
Among the search subgraphs acquired in the search subgraph acquisition step, there are a plurality of values matching the node corresponding to the keyword set to the arbitrary value in the same search subgraph, and the path structure and the path include A sub-search subgraph extraction step for extracting information of a graph structure part with matching properties as a sub-search subgraph;
The nodes included in the partial search subgraph extracted in the partial search subgraph extraction step are set to arbitrary values to search for data having a common graph structure portion related to the input keyword and the selected concept information. A common query graph pattern generating step for generating a common query graph pattern for performing
Common query graph pattern generation method characterized by having a.
前記部分検索サブグラフ抽出ステップでは、前記部分検索サブグラフを抽出する際に、前記オントロジデータ格納装置に格納されたオントロジデータを用いて、等価の意味として分類されている言葉に対応する複数のプロパティを、同一のプロパティとして抽出する
ことを特徴とする請求項4に記載の共通クエリグラフパターン生成方法。 The common query graph pattern generation device is further connected to an ontology data storage device that stores ontology data that is data in which words are classified for each equivalent meaning,
In the partial search subgraph extraction step, when extracting the partial search subgraph, using ontology data stored in the ontology data storage device, a plurality of properties corresponding to words classified as equivalent meanings, common query graph pattern generation method according to claim 4, characterized in <br/> be extracted as the same properties.
ことを特徴とする請求項4または5に記載の共通クエリグラフパターン生成方法。 In the common query graph pattern generation step, the common query graph in which the keyword acquired in the search content acquisition step is substituted as the value of the node corresponding to the keyword set to the arbitrary value in the generated common query graph pattern common query graph pattern generation method according to claim 4 or 5, characterized in <br/> generating a pattern.
入力されたキーワードと、選択された概念情報とを取得する検索内容取得機能と、
前記キーワードを値とするノードにつながるプロパティと前記選択された概念情報とそれにつながるプロパティとを固定し、前記キーワードに該当するノードを任意の値にするとともに、前記固定された2つのプロパティの間のパスに含まれるノードの値およびプロパティを任意のデータとした検索クエリグラフパターンを生成する検索クエリグラフパターン生成機能と、
前記検索クエリグラフパターン生成機能により生成された検索クエリグラフパターンの構造にマッチする部分の情報を、前記グラフ構造データ格納装置に格納されたデータベースの中から取得する検索サブグラフ取得機能と、
前記検索サブグラフ取得機能により取得された検索サブグラフのうち、前記任意の値にしたキーワードに該当するノードにマッチした値が同一の検索サブグラフの中に複数個存在する、パスの構造およびこのパスに含まれるプロパティが一致するグラフ構造部分の情報を部分検索サブグラフとして抽出する部分検索サブグラフ抽出機能と、
前記部分検索サブグラフ抽出機能により抽出された部分検索サブグラフに含まれるノードを任意の値にすることで、前記入力されたキーワードおよび選択された概念情報に関連し共通のグラフ構造部分を有するデータを検索するための共通クエリグラフパターンを生成する共通クエリグラフパターン生成機能と
を実行させる共通クエリグラフパターン生成用プログラム。 Graph structure data storage in which a database expressed in a graph structure is stored with nodes that have subject data and object data as values, and properties that indicate predicate data that is the relationship between these nodes To the common query graph pattern generation device connected to the device,
A search content acquisition function for acquiring the input keyword and the selected concept information;
The property connected to the node having the keyword as a value, the selected concept information and the property connected thereto are fixed, the node corresponding to the keyword is set to an arbitrary value, and between the two fixed properties A search query graph pattern generation function that generates a search query graph pattern using the values and properties of the nodes included in the path as arbitrary data,
A search subgraph acquisition function for acquiring information of a portion matching the structure of the search query graph pattern generated by the search query graph pattern generation function from a database stored in the graph structure data storage device;
Among the search subgraphs acquired by the search subgraph acquisition function, there are a plurality of values matching the node corresponding to the keyword set to the arbitrary value in the same search subgraph, and the path structure and this path include A partial search subgraph extraction function that extracts information of a graph structure part with matching properties as a partial search subgraph,
By searching the data included in the partial search subgraph extracted by the partial search subgraph extraction function with an arbitrary value, data having a common graph structure portion related to the input keyword and the selected concept information is searched. Common query graph pattern generation function to generate a common query graph pattern for
Common query graph pattern generation program that executes
前記部分検索サブグラフ抽出機能により、前記部分検索サブグラフを抽出する際に、前記オントロジデータ格納装置に格納されたオントロジデータを用いて、等価の意味として分類されている言葉に対応する複数のプロパティを、同一のプロパティとして抽出する
ことを特徴とする請求項7に記載の共通クエリグラフパターン生成用プログラム。 The common query graph pattern generation device is further connected to an ontology data storage device that stores ontology data that is data in which words are classified for each equivalent meaning,
When extracting the partial search subgraph by the partial search subgraph extraction function, using the ontology data stored in the ontology data storage device, a plurality of properties corresponding to words classified as equivalent meanings, common query graph pattern generation program according to claim 7, characterized in <br/> be extracted as the same properties.
ことを特徴とする請求項7または8に記載の共通クエリグラフパターン生成用プログラム。 The common query graph in which the keyword acquired by the search content acquisition function is substituted as the value of the node corresponding to the keyword set to the arbitrary value in the common query graph pattern generated by the common query graph pattern generation function common query graph pattern generation program according to claim 7 or 8, wherein <br/> generating a pattern.
入力されたキーワードと、選択された概念情報とを取得する検索内容取得手段と、
前記キーワードを値とするノードにつながるプロパティと前記選択された概念情報とそれにつながるプロパティとを固定し、前記キーワードに該当するノードを任意の値にするとともに、前記固定された2つのプロパティの間のパスに含まれるノードの値およびプロパティを任意のデータとした検索クエリグラフパターンを生成する検索クエリグラフパターン生成手段と、
前記検索クエリグラフパターン生成手段で生成された検索クエリグラフパターンの構造にマッチする部分の情報を、前記グラフ構造データ格納装置に格納されたデータベースの中から取得する検索サブグラフ取得手段と、
前記検索サブグラフ取得手段で取得された検索サブグラフのうち、前記任意の値にしたキーワードに該当するノードにマッチした値が同一の検索サブグラフの中に複数個存在する、パスの構造およびこのパスに含まれるプロパティが一致するグラフ構造部分の情報を部分検索サブグラフとして抽出する部分検索サブグラフ抽出手段と、
前記部分検索サブグラフ抽出手段で抽出された部分検索サブグラフに含まれるノードを任意の値にすることで、前記入力されたキーワードおよび選択された概念情報に関連し共通のグラフ構造部分を有するデータを検索するための共通クエリグラフパターンを生成する共通クエリグラフパターン生成手段と、
前記共通クエリグラフパターン生成手段で生成された共通クエリグラフパターンの構造にマッチする部分の情報を、前記グラフ構造データ格納装置に格納されたデータベースの中から共通サブグラフとして取得する共通サブグラフ取得手段と、
を備えることを特徴とする共通サブグラフ検索装置。 Graph structure data storage in which a database expressed in a graph structure is stored with nodes that have subject data and object data as values, and properties that indicate predicate data that is the relationship between these nodes In the common subgraph search device connected to the device,
Search content acquisition means for acquiring the input keyword and the selected concept information;
The property connected to the node having the keyword as a value, the selected concept information and the property connected thereto are fixed, the node corresponding to the keyword is set to an arbitrary value, and between the two fixed properties A search query graph pattern generating means for generating a search query graph pattern using the values and properties of nodes included in the path as arbitrary data;
Search subgraph acquisition means for acquiring information on a portion matching the structure of the search query graph pattern generated by the search query graph pattern generation means from a database stored in the graph structure data storage device;
Among the search subgraphs acquired by the search subgraph acquisition means, there are a plurality of values that match the node corresponding to the keyword set to the arbitrary value in the same search subgraph, and the path structure and this path include A partial search subgraph extracting means for extracting information of a graph structure portion having matching properties as a partial search subgraph;
The nodes included in the partial search subgraph extracted by the partial search subgraph extraction means are set to arbitrary values, thereby searching for data having a common graph structure portion related to the input keyword and the selected concept information. Common query graph pattern generating means for generating a common query graph pattern for
Common subgraph acquisition means for acquiring information on a portion matching the structure of the common query graph pattern generated by the common query graph pattern generation means as a common subgraph from a database stored in the graph structure data storage device;
A common subgraph search device comprising:
前記部分検索サブグラフ抽出手段は、前記部分検索サブグラフを抽出する際に、前記オントロジデータ格納装置に格納されたオントロジデータを用いて、等価の意味として分類されている言葉に対応する複数のプロパティを、同一のプロパティとして抽出する
ことを特徴とする請求項10に記載の共通サブグラフ検索装置。 The common subgraph search device is further connected to an ontology data storage device that stores ontology data that is data in which words are classified for each equivalent meaning,
The partial search subgraph extraction means uses the ontology data stored in the ontology data storage device to extract a plurality of properties corresponding to words classified as equivalent meanings when extracting the partial search subgraph. The common subgraph search device according to claim 10, wherein the common subgraph search device extracts the same property .
ことを特徴とする請求項10または11に記載の共通サブグラフ検索装置。 The common query graph pattern generation unit substitutes the keyword acquired by the search content acquisition unit as the value of the node corresponding to the keyword set to the arbitrary value in the generated common query graph pattern. The common subgraph search device according to claim 10 or 11, wherein a pattern is generated .
ことを特徴とする請求項10〜12何れか1項に記載の共通サブグラフ検索装置。 The common subgraph acquired by the common subgraph acquisition unit is converted into data for displaying the value of each node and the data indicated by each property in a tabular format for each piece of information matching the structure of the common query graph pattern. The common subgraph search device according to any one of claims 10 to 12 , further comprising display data conversion means .
入力されたキーワードと、選択された概念情報とを取得する検索内容取得ステップと、
前記キーワードを値とするノードにつながるプロパティと前記選択された概念情報とそれにつながるプロパティとを固定し、前記キーワードに該当するノードを任意の値にするとともに、前記固定された2つのプロパティの間のパスに含まれるノードの値およびプロパティを任意のデータとした検索クエリグラフパターンを生成する検索クエリグラフパターン生成ステップと、
前記検索クエリグラフパターン生成ステップで生成された検索クエリグラフパターンの構造にマッチする部分の情報を、前記グラフ構造データ格納装置に格納されたデータベースの中から取得する検索サブグラフ取得ステップと、
前記検索サブグラフ取得ステップにおいて取得された検索サブグラフのうち、前記任意の値にしたキーワードに該当するノードにマッチした値が同一の検索サブグラフの中に複数個存在する、パスの構造およびこのパスに含まれるプロパティが一致するグラフ構造部分の情報を部分検索サブグラフとして抽出する部分検索サブグラフ抽出ステップと、
前記部分検索サブグラフ抽出ステップにおいて抽出された部分検索サブグラフに含まれるノードを任意の値にすることで、前記入力されたキーワードおよび選択された概念情報に関連し共通のグラフ構造部分を有するデータを検索するための共通クエリグラフパターンを生成する共通クエリグラフパターン生成ステップと、
前記共通クエリグラフパターン生成ステップにおいて生成された共通クエリグラフパターンの構造にマッチする部分の情報を、前記グラフ構造データ格納装置に格納されたデータベースの中から共通サブグラフとして取得する共通サブグラフ取得ステップと、
を有することを特徴とする共通サブグラフ検索方法。 Graph structure data storage in which a database expressed in a graph structure is stored with nodes that have subject data and object data as values, and properties that indicate predicate data that is the relationship between these nodes A common subgraph search device connected to the device
A search content acquisition step for acquiring the input keyword and the selected concept information;
The property connected to the node having the keyword as a value, the selected concept information and the property connected thereto are fixed, the node corresponding to the keyword is set to an arbitrary value, and between the two fixed properties A search query graph pattern generation step for generating a search query graph pattern using the values and properties of the nodes included in the path as arbitrary data;
A search subgraph acquisition step for acquiring information on a portion matching the structure of the search query graph pattern generated in the search query graph pattern generation step from a database stored in the graph structure data storage device;
Among the search subgraphs acquired in the search subgraph acquisition step, there are a plurality of values that match the node corresponding to the keyword set to the arbitrary value in the same search subgraph, and the path structure and the path include A sub-search subgraph extraction step for extracting information of a graph structure part with matching properties as a sub-search subgraph;
The nodes included in the partial search subgraph extracted in the partial search subgraph extraction step are set to arbitrary values to search for data having a common graph structure portion related to the input keyword and the selected concept information. Generating a common query graph pattern for generating a common query graph pattern,
A common subgraph acquisition step of acquiring, as a common subgraph, information on a portion that matches the structure of the common query graph pattern generated in the common query graph pattern generation step, from a database stored in the graph structure data storage device;
Common subgraph search method characterized by having a.
前記部分検索サブグラフ抽出ステップでは、前記部分検索サブグラフを抽出する際に、前記オントロジデータ格納装置に格納されたオントロジデータを用いて、等価の意味として分類されている言葉に対応する複数のプロパティを、同一のプロパティとして抽出する
ことを特徴とする請求項14に記載の共通サブグラフ検索方法。 The common subgraph search device is further connected to an ontology data storage device that stores ontology data that is data in which words are classified for each equivalent meaning,
In the partial search subgraph extraction step, when extracting the partial search subgraph, using ontology data stored in the ontology data storage device, a plurality of properties corresponding to words classified as equivalent meanings, The common subgraph search method according to claim 14, wherein the common subgraphs are extracted as the same property .
ことを特徴とする請求項14または15に記載の共通サブグラフ検索方法。 In the common query graph pattern generation step, the common query graph in which the keyword acquired in the search content acquisition step is substituted as the value of the node corresponding to the keyword set to the arbitrary value in the generated common query graph pattern common subgraph searching method according to claim 14 or 15, characterized in <br/> generating a pattern.
ことを特徴とする請求項14〜16何れか1項に記載の共通サブグラフ検索方法。 The common subgraph acquired in the common subgraph acquisition step is converted into data for displaying the value of each node and the data indicated by each property in a tabular format for each piece of information matching the structure of the common query graph pattern. The common subgraph search method according to any one of claims 14 to 16 , further comprising a display data conversion step .
入力されたキーワードと、選択された概念情報とを取得する検索内容取得機能と、
前記キーワードを値とするノードにつながるプロパティと前記選択された概念情報とそれにつながるプロパティとを固定し、前記キーワードに該当するノードを任意の値にするとともに、前記固定された2つのプロパティの間のパスに含まれるノードの値およびプロパティを任意のデータとした検索クエリグラフパターンを生成する検索クエリグラフパターン生成機能と、
前記検索クエリグラフパターン生成機能により生成された検索クエリグラフパターンの構造にマッチする部分の情報を、前記グラフ構造データ格納装置に格納されたデータベースの中から取得する検索サブグラフ取得機能と、
前記検索サブグラフ取得機能により取得された検索サブグラフのうち、前記任意の値にしたキーワードに該当するノードにマッチした値が同一の検索サブグラフの中に複数個存在する、パスの構造およびこのパスに含まれるプロパティが一致するグラフ構造部分の情報を部分検索サブグラフとして抽出する部分検索サブグラフ抽出機能と、
前記部分検索サブグラフ抽出機能により抽出された部分検索サブグラフに含まれるノードを任意の値にすることで、前記入力されたキーワードおよび選択された概念情報に関連し共通のグラフ構造部分を有するデータを検索するための共通クエリグラフパターンを生成する共通クエリグラフパターン生成機能と、
前記共通クエリグラフパターン生成機能により生成された共通クエリグラフパターンの構造にマッチする部分の情報を、前記グラフ構造データ格納装置に格納されたデータベースの中から共通サブグラフとして取得する共通サブグラフ取得機能と、
を実行させることを特徴とする共通サブグラフ検索用プログラム。 Graph structure data storage in which a database expressed in a graph structure is stored with nodes that have subject data and object data as values, and properties that indicate predicate data that is the relationship between these nodes To the common subgraph search device connected to the device,
A search content acquisition function for acquiring the input keyword and the selected concept information;
The property connected to the node having the keyword as a value, the selected concept information and the property connected thereto are fixed, the node corresponding to the keyword is set to an arbitrary value, and between the two fixed properties A search query graph pattern generation function that generates a search query graph pattern using the values and properties of nodes included in the path as arbitrary data,
A search subgraph acquisition function for acquiring information of a portion matching the structure of the search query graph pattern generated by the search query graph pattern generation function from a database stored in the graph structure data storage device;
Among the search subgraphs acquired by the search subgraph acquisition function, there are a plurality of values matching the node corresponding to the keyword set to the arbitrary value in the same search subgraph, and the path structure and this path include A partial search subgraph extraction function that extracts information of the graph structure part with matching properties as a partial search subgraph,
By searching the data included in the partial search subgraph extracted by the partial search subgraph extraction function with an arbitrary value, data having a common graph structure portion related to the input keyword and the selected concept information is searched. A common query graph pattern generation function for generating a common query graph pattern for
A common subgraph acquisition function for acquiring, as a common subgraph, information on a portion matching the structure of the common query graph pattern generated by the common query graph pattern generation function from a database stored in the graph structure data storage device;
A program for searching a common subgraph, characterized in that
前記部分検索サブグラフ抽出機能により、前記部分検索サブグラフを抽出する際に、前記オントロジデータ格納装置に格納されたオントロジデータを用いて、等価の意味として分類されている言葉に対応する複数のプロパティを、同一のプロパティとして抽出する
ことを特徴とする請求項18に記載の共通サブグラフ検索用プログラム。 The common subgraph search device is further connected to an ontology data storage device that stores ontology data that is data in which words are classified for each equivalent meaning,
When extracting the partial search subgraph by the partial search subgraph extraction function, using the ontology data stored in the ontology data storage device, a plurality of properties corresponding to words classified as equivalent meanings, The common subgraph search program according to claim 18, wherein the common property is extracted as the same property .
ことを特徴とする請求項18または19に記載の共通サブグラフ検索用プログラム。 In the common query graph pattern generation function, the common query graph in which the keyword acquired by the search content acquisition function is substituted as the value of the node corresponding to the keyword set to the arbitrary value in the generated common query graph pattern The common subgraph search program according to claim 18 or 19, wherein a pattern is generated .
ことを特徴とする請求項18〜20何れか1項に記載の共通サブグラフ検索用プログラム。 The common subgraph acquired by the common subgraph acquisition function is converted into data for displaying the value of each node and the data indicated by each property in a tabular format for each piece of information matching the structure of the common query graph pattern. The common subgraph search program according to any one of claims 18 to 20 , further comprising a display data conversion function .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005136706A JP4547300B2 (en) | 2005-05-09 | 2005-05-09 | Common query graph pattern generation device, generation method, generation program, and common subgraph search device, search method, and search program using the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005136706A JP4547300B2 (en) | 2005-05-09 | 2005-05-09 | Common query graph pattern generation device, generation method, generation program, and common subgraph search device, search method, and search program using the same |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006313501A JP2006313501A (en) | 2006-11-16 |
JP4547300B2 true JP4547300B2 (en) | 2010-09-22 |
Family
ID=37534960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005136706A Active JP4547300B2 (en) | 2005-05-09 | 2005-05-09 | Common query graph pattern generation device, generation method, generation program, and common subgraph search device, search method, and search program using the same |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4547300B2 (en) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4698619B2 (en) * | 2007-01-24 | 2011-06-08 | 日本電信電話株式会社 | Centrality value calculation apparatus and centrality value calculation method |
JP4698618B2 (en) * | 2007-01-24 | 2011-06-08 | 日本電信電話株式会社 | Relationship extraction method and relationship extraction system |
JP4789814B2 (en) * | 2007-01-24 | 2011-10-12 | 日本電信電話株式会社 | Cluster generation apparatus and cluster generation method |
JP5271808B2 (en) * | 2009-05-28 | 2013-08-21 | 日本電信電話株式会社 | Common query graph pattern generation device, common query graph pattern generation method, and common query graph pattern generation program |
JP5210970B2 (en) * | 2009-05-28 | 2013-06-12 | 日本電信電話株式会社 | Common query graph pattern generation method, common query graph pattern generation device, and common query graph pattern generation program |
JP5314504B2 (en) * | 2009-06-01 | 2013-10-16 | 日本電信電話株式会社 | SEARCH DEVICE, SEARCH PROGRAM, AND SEARCH METHOD |
EP2570936A4 (en) | 2010-05-14 | 2015-08-19 | Nec Corp | Information retrieval device, information retrieval method, computer program, and data structure |
JP5225350B2 (en) * | 2010-09-28 | 2013-07-03 | 株式会社東芝 | Information retrieval device |
JP2012128479A (en) * | 2010-12-13 | 2012-07-05 | Fuji Xerox Co Ltd | Retrieval device and program |
JP5747749B2 (en) * | 2011-09-06 | 2015-07-15 | 富士ゼロックス株式会社 | Search device and program |
JP5866922B2 (en) * | 2011-09-22 | 2016-02-24 | 富士ゼロックス株式会社 | Search device and program |
US10566081B2 (en) | 2016-12-09 | 2020-02-18 | International Business Machines Corporation | Method and system for automatic knowledge-based feature extraction from electronic medical records |
JP2021125182A (en) * | 2020-02-10 | 2021-08-30 | 富士通株式会社 | Information processing program, information processing method, information processor, data structure of graph data, and graph data generation method |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003099469A (en) * | 2001-09-26 | 2003-04-04 | Fujitsu Ltd | Retrieval display device |
JP2003228580A (en) * | 2002-02-04 | 2003-08-15 | Celestar Lexico-Sciences Inc | Controller and method for controlling document knowledge, program, and recording medium |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3168829B2 (en) * | 1993-10-30 | 2001-05-21 | 富士ゼロックス株式会社 | Search formula creation support system |
-
2005
- 2005-05-09 JP JP2005136706A patent/JP4547300B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003099469A (en) * | 2001-09-26 | 2003-04-04 | Fujitsu Ltd | Retrieval display device |
JP2003228580A (en) * | 2002-02-04 | 2003-08-15 | Celestar Lexico-Sciences Inc | Controller and method for controlling document knowledge, program, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP2006313501A (en) | 2006-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5271808B2 (en) | Common query graph pattern generation device, common query graph pattern generation method, and common query graph pattern generation program | |
KR101646754B1 (en) | Apparatus and Method of Mobile Semantic Search | |
JP4547300B2 (en) | Common query graph pattern generation device, generation method, generation program, and common subgraph search device, search method, and search program using the same | |
US8620941B2 (en) | Apparatus and method of searching and visualizing instance path | |
KR100995861B1 (en) | Module and method for searching named entity of terms from the named entity database using named entity database and mining rule merged ontology schema | |
JP5021845B2 (en) | Multiple entity centric integrated search system and method | |
JP5844824B2 (en) | SPARQL query optimization method | |
JP4698618B2 (en) | Relationship extraction method and relationship extraction system | |
JP4547298B2 (en) | Extended query graph pattern generation device, generation method, generation program, and extended subgraph search device, search method, and search program using them | |
US8965910B2 (en) | Apparatus and method of searching for instance path based on ontology schema | |
JP2013054602A (en) | Graph pattern matching system and graph pattern matching method | |
JP5210970B2 (en) | Common query graph pattern generation method, common query graph pattern generation device, and common query graph pattern generation program | |
US9886497B2 (en) | Indexing presentation slides | |
JP4547299B2 (en) | Inverted query graph pattern generation device, generation method, generation program, and inverted subgraph search device, search method, and search program using the same | |
Dorn et al. | Structuring meta-search research by design patterns | |
POSEDARU et al. | Natural Learning Processing based on Machine Learning Model for automatic analysis of Online Reviews related to Hotels and Resorts. | |
Taveekarn et al. | Data++: An automated tool for intelligent data augmentation using wikidata | |
JP5914186B2 (en) | Information processing apparatus and information processing method | |
TW201113729A (en) | Method for creating index in database, computer system thereof, and computer program product thereof | |
Er et al. | Set of tuples expansion by example with reliability | |
JP2005327316A (en) | Integrated retrieval system | |
KR101541299B1 (en) | Method and apparatus of generating contents semantic network based on the user description | |
Peeters et al. | The Web Data Commons Schema. org Table Corpora | |
KR20170088466A (en) | A method of partial matching for graph data | |
Hasnain | Improving discovery in life sciences linked open data cloud |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070808 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100524 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100622 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100705 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130709 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4547300 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |