JP7091685B2 - Search processing program, search processing method and search processing device - Google Patents
Search processing program, search processing method and search processing device Download PDFInfo
- Publication number
- JP7091685B2 JP7091685B2 JP2018020734A JP2018020734A JP7091685B2 JP 7091685 B2 JP7091685 B2 JP 7091685B2 JP 2018020734 A JP2018020734 A JP 2018020734A JP 2018020734 A JP2018020734 A JP 2018020734A JP 7091685 B2 JP7091685 B2 JP 7091685B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- user
- word
- converted
- search word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、検索処理プログラム、検索処理方法及び検索処理装置に関する。 The present invention relates to a search processing program, a search processing method, and a search processing apparatus.
従来、社内のデータベースに蓄積されたレポートなどの文書の中から必要とする文書を探し出す場合、ユーザは、探し出したい文書に含まれている可能性の高い検索ワードを用いてデータベース内を検索するのが一般的である。この場合、業務経験が豊富なユーザであれば、経験に基づいて適切な検索ワードを設定することができる。 Traditionally, when searching for a required document from documents such as reports stored in an in-house database, users search the database using search words that are likely to be included in the document they want to find. Is common. In this case, a user with abundant work experience can set an appropriate search word based on the experience.
しかしながら、業務経験が乏しいユーザの場合には、適切な検索ワードを設定することができないことがあるため、自分が必要としている文書を探し出せないおそれがある。 However, if the user has little work experience, he / she may not be able to set an appropriate search word, so that he / she may not be able to find the document he / she needs.
1つの側面では、本発明は、検索精度を向上させることが可能な検索処理プログラム、検索処理方法及び検索処理装置を提供することを目的とする。 In one aspect, it is an object of the present invention to provide a search processing program, a search processing method, and a search processing apparatus capable of improving search accuracy.
一つの態様では、検索処理プログラムは、複数のユーザのそれぞれに対応する検索条件を受け付け、前記複数のユーザそれぞれに対応する検索結果に関する評価の入力を受け付け、受け付けた前記評価を演算処理した結果から前記評価が高いユーザを特定し、前記評価が高いユーザとは異なるユーザに対応する検索条件を受け付けた場合に、前記評価が高いユーザの検索履歴に基づいて前記検索条件を変換し、変換して得られた検索条件による検索を実行する、処理をコンピュータに実行させる検索処理プログラムである。 In one embodiment, the search processing program accepts search conditions corresponding to each of a plurality of users, receives input of evaluations relating to search results corresponding to each of the plurality of users, and performs arithmetic processing on the received evaluations. When a user with a high evaluation is specified and a search condition corresponding to a user different from the user with a high evaluation is accepted, the search condition is converted and converted based on the search history of the user with a high evaluation. It is a search processing program that causes a computer to execute a search based on the obtained search conditions.
検索精度を向上させることができる。 Search accuracy can be improved.
以下、検索処理システムの一実施形態について、図1~図10に基づいて詳細に説明する。本実施形態の検索処理システムは、会社で管理する文書(電子データ)をユーザが検索する場合に、業務経験が豊富なユーザ(有識者と呼ぶ)でないユーザであっても、有識者と同様に検索ができるように検索を支援し、ユーザに対して検索結果及び検索された文書のデータを提供するシステムである。 Hereinafter, an embodiment of the search processing system will be described in detail with reference to FIGS. 1 to 10. In the search processing system of the present embodiment, when a user searches for a document (electronic data) managed by a company, even a user who is not a user with abundant work experience (called an expert) can search in the same manner as an expert. It is a system that supports the search so that it can be done, and provides the user with the search results and the data of the searched document.
図1には、本実施形態に係る検索処理システム100の構成が概略的に示されている。図1に示すように、検索処理システム100は、検索処理装置としてのサーバ10と、ユーザ端末70と、を備える。サーバ10及びユーザ端末70は、インターネットやLAN(Local Area Network)などのネットワーク80に接続されている。
FIG. 1 schematically shows the configuration of the
(サーバ10)
図2(a)には、サーバ10のハードウェア構成が示されている。図2(a)に示すように、サーバ10は、CPU(Central Processing Unit)90、ROM(Read Only Memory)92、RAM(Random Access Memory)94、記憶部(ここではHDD(Hard Disk Drive))96、ネットワークインタフェース97、及び可搬型記憶媒体用ドライブ99等を備えている。これらサーバ10の構成各部は、バス98に接続されている。サーバ10では、ROM92あるいはHDD96に格納されているプログラム(検索処理プログラムを含む)、或いは可搬型記憶媒体用ドライブ99が可搬型記憶媒体91から読み取ったプログラムをCPU90が実行することにより、図3に示す、各部の機能が実現される。なお、図3には、サーバ10のHDD96等に格納されているデータベース(database:DB)やテーブルも図示されている。
(Server 10)
FIG. 2A shows the hardware configuration of the
図3には、サーバ10の機能ブロック図が示されている。図3に示すように、サーバ10においては、CPU90がプログラムを実行することにより、入力受付部20、検索ワード変換部22、検索実行部24、提供部26、特定部としての評価部28、更新部30、としての機能が実現されている。なお、図3の各部の機能は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
FIG. 3 shows a functional block diagram of the
入力受付部20は、ユーザが検索画面(図7(a)参照)又は検索画面(初心者用)(図9(a)参照)に入力した検索ワードを取得し、検索実行部24又は検索ワード変換部22に受け渡す。また、入力受付部20は、ユーザにより画面上のボタンが押されたという情報を取得し、各部に通知する。なお、ユーザは、文書の検索を行う際には、図7(a)の検索画面又は図9(a)の検索画面(初心者用)のいずれかを選択して用いるものとする。
The
検索ワード変換部22は、必要に応じて、ユーザが入力した検索ワードを変換し、変換後の検索ワードを検索実行部24に受け渡す。なお、検索ワード変換部22は、類義語辞書DB45、ユーザテーブル42、頻度テーブル46、TF-IDFテーブル48を用いた処理を実行する。類義語辞書DB45は、類義語を関連付けて格納するデータベースであり、例えば、「性能試験」と「性能テスト」と、「有用性試験」が類義語であること等の情報が格納されている。なお、ユーザテーブル42、頻度テーブル46及びTF-IDFテーブル48の詳細や、検索ワード変換部22の処理の詳細については後述する。
The search
検索実行部24は、ユーザが入力した検索ワードや検索ワード変換部22が変換した後の検索ワードを用いて、ドキュメントDB40に格納されている膨大な量の文書の中から文書を検索する。また、検索実行部24は、検索された文書の情報を検索結果としてユーザ端末70に送信する。更に、検索実行部24は、有識者が図7(a)の検索画面を用いて検索を行った場合に、検索に用いた検索ワードを検索履歴テーブル44に格納する。
The
ここで、検索実行部24は、図7(a)の検索画面を用いて検索をしたユーザが「有識者」であるか「一般」であるかを、ユーザテーブル42に基づいて判断する。図4(a)には、ユーザテーブル42のテーブル構造が示されている。ユーザテーブル42には、「ユーザ」、「評価平均値」、「区分」、「部門」の各情報が関連付けて格納されている。「ユーザ」の欄には、ユーザの氏名や識別番号等が格納される。「評価平均値」の欄には、ユーザが自らの検索について評価した点数の平均値が格納される。「区分」の欄には、各ユーザの評価平均値から定まる各ユーザの区分が格納される。区分には、「有識者」と「一般」がある。「有識者」は、例えば評価平均値が閾値以上であり、業務経験が豊富なユーザを意味し、「一般」は、例えば評価平均値が閾値未満であり、業務経験が然程豊富でないユーザを意味するものとする。なお、これに限らず、全ユーザのうち、評価平均値が高い方から上位所定割合のユーザを有識者として設定することとしてもよい。「部門」の欄には、各ユーザが所属する会社内の部門の情報であり、経理部、事業部、A部門、B部門などの情報が格納される。
Here, the
図4(b)には、検索履歴テーブル44のテーブル構造が示されている。図4(b)に示すように、検索履歴テーブル44には、「有識者」と、「ワード1」、「ワード2」、…の情報が格納されている。「有識者」の欄には、有識者であるユーザの氏名や識別番号等が格納され、「ワード1」、「ワード2」、…の欄には、有識者が検索に用いた検索ワードが格納される。なお、検索履歴テーブル44において列方向に並ぶ1回の検索で用いられたワードを、「検索ワード群」とも呼ぶものとする。 FIG. 4B shows the table structure of the search history table 44. As shown in FIG. 4B, the search history table 44 stores information about the "intellectual person", "word 1", "word 2", and so on. The name and identification number of the user who is an expert is stored in the "knowledgeable person" column, and the search word used by the expert in the search is stored in the "word 1", "word 2", ... .. The words used in one search arranged in the column direction in the search history table 44 are also referred to as "search word group".
提供部26は、検索実行部24の検索結果の中からユーザが1つの文書を選択すると、選択された文書の概要を示す情報をユーザ端末70に対して送信する。また、提供部26は、ユーザから文書をダウンロードする旨の要求があると、ダウンロード要求のあった文書をドキュメントDB40から読み出し、ユーザ端末70に対して送信(ダウンロード)する。
When the user selects one document from the search results of the
評価部28は、ユーザがユーザ端末70において文書をダウンロードした場合に、ユーザに対し、今回の検索についての評価を問い合わせ、評価結果に基づいてユーザテーブル42を更新する。なお、図3では、破線がテーブルの「更新」を意味している。
When the user downloads the document on the
更新部30は、ユーザテーブル42及び検索履歴テーブル44のデータに基づいて頻度テーブル46を更新するとともに、検索履歴テーブル44のデータ及びドキュメントDB40に格納されている文書に基づいて、TF-IDFテーブル48を更新する。なお、更新部30は、各テーブルの更新処理を1日1回や1週間に1回などの頻度でバッチ処理により実行する。
The
図5(a)には、頻度テーブル46のテーブル構造が示されている。図5(a)に示すように、頻度テーブル46には、各検索ワード(「溶媒」、「アセトン」等)を、各部門の有識者がどのくらいの頻度で検索に用いたかの情報(出現頻度)が格納されている。例えば、A部門におけるワードαの出現頻度FAαは、A部門の有識者がワードαを用いた検索を行った回数をMAα、A部門の有識者が行った全検索回数をNAとすると、次式(1)で表すことができる。
FAα=MAα/NA …(1)
FIG. 5A shows the table structure of the frequency table 46. As shown in FIG. 5A, the frequency table 46 contains information (appearance frequency) on how often experts in each department used each search word (“solvent”, “acetone”, etc.) in the search. It is stored. For example, the frequency of appearance of the word α in the A department F Aα is as follows, assuming that the number of searches performed by the experts in the A department using the word α is M Aα and the total number of searches performed by the experts in the A department is NA. It can be expressed by the equation (1).
F Aα = MAα / NA… (1)
更新部30は、ユーザテーブル42に基づいて各部門の有識者を特定し、検索履歴テーブル44を参照して、部門ごとに各ワードの出現頻度を算出し、頻度テーブル46を更新する。
The
図5(b)には、TF-IDFテーブル48のテーブル構造が示されている。図5(b)に示すように、TF-IDFテーブル48には、各検索ワード(「溶媒」、「アセトン」等)についての、「TF(Term Frequency)値」、「IDF(Inverse Document Frequency)値」、「TF-IDF値」、「TF-IDF値の分散」の各値が格納されている。ここで、「TF値」は、各検索ワードが、ドキュメントDB40に格納されている全ての文書において出現する頻度を意味する。また、「IDF値」は、各検索ワードがいくつの文書内で共通して使われているかを表す値であり、値が小さいほど文書にあまり出てこないことを意味する。「TF-IDF値」は、上述したTF値と、上述したIDF値の積である。TF-IDF値の分散は、ある検索ワードについて文書毎に求められるTF値と上記IDF値の積である文書毎のTF-IDF値が、どれだけばらついているかを示す値である。TF-IDF値の分散が小さい検索ワードは、どの文書でもそのワードが同程度に出現していることを示し、TF-IDF値の分散が大きい検索ワードほど、文書の分類に貢献しているワードであることを意味している。
FIG. 5B shows the table structure of the TF-IDF table 48. As shown in FIG. 5B, the TF-IDF table 48 shows the “TF (Term Frequency) value” and “IDF (Inverse Document Frequency)” for each search word (“solvent”, “acetone”, etc.). Each value of "value", "TF-IDF value", and "dispersion of TF-IDF value" is stored. Here, the "TF value" means the frequency with which each search word appears in all the documents stored in the
更新部30は、検索履歴テーブル44に基づいて、検索に用いられた検索ワードを特定し、特定された検索ワードごとに、ドキュメントDB40を用いてTF-IDFテーブル48の各値を算出し、更新する。
The
(ユーザ端末70)
図1に戻り、ユーザ端末70は、会社内のユーザが利用する端末である。ユーザは、ユーザ端末70に検索ワードを入力して所定の操作を行うことで、サーバ10により検索された文書を閲覧したり、利用したりすることができる。
(User terminal 70)
Returning to FIG. 1, the
図2(b)には、ユーザ端末70のハードウェア構成が示されている。図2(b)に示すように、ユーザ端末70は、CPU190、ROM192、RAM194、記憶部(HDD)196、ネットワークインタフェース197、表示部193、入力部195、及び可搬型記憶媒体191に記憶された情報を読み取り可能な可搬型記憶媒体用ドライブ199等を備えている。表示部193は、液晶ディスプレイ等を含み、入力部195は、マウスやキーボード、タッチパネル等を含む。これらユーザ端末70の構成各部は、バス198に接続されている。
FIG. 2B shows the hardware configuration of the
(サーバ10の処理について)
次に、サーバ10の処理について、図6及び図8のフローチャートに沿って、その他図面を適宜参照しつつ詳細に説明する。
(About the processing of server 10)
Next, the process of the
図6には、ユーザが図7(a)の検索画面を利用して検索を行う場合のサーバ10の処理が示され、図8には、ユーザが図9(a)の検索画面(初心者用)を利用して検索を行う場合のサーバ10の処理が示されている。
FIG. 6 shows the processing of the
(検索画面を利用して検索を行う場合の処理)
まず、図6に基づいて、ユーザが検索画面を利用して検索を行う場合のサーバ10の処理について説明する。なお、図6の処理の前提として、ユーザからの要求に応じて、入力受付部20は、図7(a)に示すような検索画面をユーザ端末70に送信しているものとする。したがって、ユーザ端末70の表示部193には、図7(a)の検索画面が表示されているものとする。図7(a)の検索画面には、検索ワードを入力する欄と、「検索」ボタンと、検索結果を表示する欄と、が設けられている。
(Processing when searching using the search screen)
First, based on FIG. 6, the processing of the
図6の処理では、まず、ステップS10において、入力受付部20が、検索画面に検索ワードが入力され「検索」ボタンが押されるまで待機する。図7(a)に示すように、例えばユーザが検索ワード群「溶媒 植物性 有用性」を入力して、「検索」ボタンを押すと、ステップS12に移行する。なお、「検索」ボタンが押されると、ユーザ端末70から入力された検索ワード(検索ワード群)が送信されてくるので、入力受付部20は、受信した検索ワードを検索実行部24に対して受け渡す。
In the process of FIG. 6, first, in step S10, the
ステップS12に移行すると、検索実行部24は、入力された検索ワードを用いてドキュメントDB40内の文書の検索を実行し、検索結果をユーザ端末70に送信する。これにより、ユーザ端末70の表示部193には、検索結果が表示されるようになっている。なお、図7(a)には、検索結果として、3つの文書の情報が表示された状態が示されている。
When the process proceeds to step S12, the
次いで、ステップS14では、入力受付部20が、検索結果の1つがユーザ端末70において選択されるまで待機する。ユーザ端末70において、ユーザが検索結果の中から1つの文書を選択すると、入力受付部20は、その旨を提供部26に通知し、ステップS16に移行する。
Next, in step S14, the
ステップS16では、提供部26が、選択された文書の概要を示す画面をユーザ端末70に対して送信する。これにより、ユーザ端末70の表示部193には、図7(b)に示すような文書の概要を表示する画面が表示されることになる。なお、図7(b)の画面には、「ダウンロード」ボタンも表示されているものとする。
In step S16, the providing
次いで、ステップS18では、入力受付部20が、ユーザ端末70において、ユーザにより「ダウンロード」ボタンが押されるまで待機する。ユーザ端末70においてユーザにより「ダウンロード」ボタンが押されると、入力受付部20は、その旨を提供部26に通知し、ステップS20に移行する。
Next, in step S18, the
ステップS20に移行すると、提供部26は、ドキュメントDB40からユーザによって選択された文書のデータを読み出し、ユーザ端末70に送信する(ダウンロードを行う)。
When the process proceeds to step S20, the providing
ステップS20の後は、ステップS22に移行し、評価部28が、検索評価画面をユーザ端末70に送信する。これにより、ユーザ端末70の表示部193には、図7(c)に示すような検索評価画面が表示されることになる。なお、検索評価画面は、ユーザが実施した検索結果に対する満足度を例えば11段階(0点~10点)で評価する画面である。ユーザは、点数を選択するとともに、「送信」ボタンを押すことで、評価結果をサーバ10(入力受付部20)に対して送信することができる。
After step S20, the process proceeds to step S22, and the
次いで、ステップS24では、入力受付部20が、ユーザ端末70において「送信」ボタンが押されるまで待機する。ユーザによって「送信」ボタンが押されると、入力受付部20は、ユーザ端末70から送信されてくる点数を評価部28に通知し、ステップS26に移行する。
Next, in step S24, the
ステップS26に移行すると、評価部28は、ユーザによって選択された(入力された)評価点と、これまでに得られた評価点との平均値を算出して、ユーザテーブル42の「評価平均値」の欄を更新する。なお、評価部28は、評価平均値の更新により、ユーザの区分を変更する必要が生じた場合には、区分の変更も行う。例えば、ユーザが「有識者」となるために、「評価平均値が所定の閾値以上であること」という基準を満たす必要がある場合には、評価部28は、更新後の評価平均値が閾値以上であるか否かを判断し、判断結果に基づいて区分を更新する。
When the process proceeds to step S26, the
次いで、ステップS28では、検索実行部24が、検索を行ったユーザが「有識者」である場合に、入力された検索ワードで検索履歴テーブル44を更新する。より具体的には、検索実行部24は、ユーザが有識者であるか否かをユーザテーブル42を参照して判断し、ユーザが有識者であれば、図7(a)の画面において入力された検索ワード群「溶媒 植物性 有用性」と、ユーザの識別情報を検索履歴テーブル44に追加する。
Next, in step S28, the
以上により、図6の全処理が終了する。なお、図6の処理は、ユーザから図7(a)の検索画面を用いた検索要求が出されるたびに、繰り返し実行される。 With the above, all the processing of FIG. 6 is completed. The process of FIG. 6 is repeatedly executed every time a search request using the search screen of FIG. 7A is issued by the user.
(検索画面(初心者用)を利用して検索を行う場合の処理)
次に、図8に基づいて、ユーザが検索画面(初心者用)を利用して検索を行う場合のサーバ10の処理について説明する。なお、図8の処理の前提として、ユーザからの要求に応じて、入力受付部20は、図9(a)に示すような検索画面(初心者用)をユーザ端末70に送信しているものとする。したがって、ユーザ端末70の表示部193には、図9(a)の検索画面(初心者用)が表示されているものとする。図9(a)の画面には、「検索」ボタンの他、「類義語変換」ボタンと「履歴から変換」ボタンが設けられている。なお、「類義語変換」ボタンが押されるまでは「履歴から変換」ボタンは押せない(選択できない)状態になっているものとする。
(Processing when searching using the search screen (for beginners))
Next, based on FIG. 8, the processing of the
図8のステップS102では、入力受付部20が、検索画面(初心者用)に検索ワードが入力されるまで待機する。図9(a)に示すように、例えばユーザが検索ワード群「アセトン 海外 性能試験」を入力した場合、ステップS104に移行する。
In step S102 of FIG. 8, the
ステップS104に移行すると、入力受付部20が、既に「類義語変換」ボタンが押されたか否かを判断する。このステップS104の判断が否定されると、ステップS106に移行する。
When the process proceeds to step S104, the
ステップS106に移行すると、入力受付部20が、「類義語変換」ボタンが押されたか否かを判断する。このステップS106の判断が否定された場合には、ステップS120に移行し、入力受付部20は、「検索」ボタンが押されたか否かを判断する。このステップS120の判断が否定されると、ステップS104に戻る。すなわち、ステップS106又はステップS120の判断が肯定されるまで、ステップS104、S106、S120の判断が繰り返し実行される。なお、ユーザは、図9(a)に示す検索ワード群「アセトン 海外 性能試験」で検索を行いたい場合には、「検索」ボタンを押し、検索ワードを適切なワードに変換したい場合には、「履歴から変換」ボタンを押す。
When the process proceeds to step S106, the
ユーザが「検索」ボタンを押した場合、ステップS120の判断が肯定されるため、ステップS122に移行する。ステップS122では、検索実行部24は、入力された検索ワード群「アセトン 海外 性能試験」を用いてドキュメントDB40を検索し、検索結果を検索画面(初心者用)に表示する。
When the user presses the "search" button, the determination in step S120 is affirmed, so the process proceeds to step S122. In step S122, the
一方、ユーザが「類義語変換」ボタンを押した場合、ステップS106の判断が肯定されるため、ステップS108に移行する。ステップS108に移行すると、検索ワード変換部22が、各検索ワードの類義語を類義語辞書DB45から抽出する。例えば、入力された検索ワードが検索ワード群「アセトン 海外 性能試験」である場合において、類義語辞書DB45に「性能試験」と「性能テスト」と、「有用性試験」が類義語であるという情報が含まれていたとする。この場合、検索ワード変換部22は、「性能試験」の類義語として「性能テスト」と、「有用性試験」を抽出する。なお、「アセトン」や「海外」に類義語が存在する場合には、同様に抽出するが、説明の簡素化のため、類義語が存在しなかったものとする。
On the other hand, when the user presses the "synonym conversion" button, the determination in step S106 is affirmed, so the process proceeds to step S108. When the process proceeds to step S108, the search
次いで、ステップS110では、検索ワード変換部22が、同じ部門の有識者の検索における各類義語(検索ワードを含む)の出現頻度を特定する。具体的には、検索ワード変換部22は、ユーザテーブル42を参照して、検索を行っているユーザが例えばA部門であることを特定すると、頻度テーブル46を参照して、A部門のユーザの検索履歴における、「性能試験」と「性能テスト」と、「有用性試験」の出現頻度を特定する。
Next, in step S110, the search
次いで、ステップS112では、検索ワード変換部22が、類義語(検索ワードを含む)のうち出現頻度が最も高いものを検索ワードとする。上記例において、「性能試験」の出現頻度が0.1、「性能テスト」の出現頻度が0.2、「有用性試験」の出現頻度が0.3であったとすると、出現頻度が最も高い「有用性試験」が検索ワードとなる。すなわち、検索ワード変換部22は、図9(b)に示すように、検索ワード群を図9(a)の「アセトン 海外 性能試験」から、「アセトン 海外 有用性試験」に変換する。これにより、ユーザが検索したい内容を変えることなく、入力した検索ワードを部門内でよく使われる検索に適した検索ワードに変換することができる。なお、複数の検索ワードに類義語が存在していた場合には、それぞれについて、出現頻度に基づく変換を行う。
Next, in step S112, the search
次いで、ステップS114では、入力受付部20が、「履歴から変換」ボタンが押されたか否かを判断する。このステップS114の判断が否定された場合には、ステップS120に移行し、入力受付部20は、「検索」ボタンが押されたか否かを判断する。ステップS120の判断が否定されると、ステップS104に戻るが、ステップS104の判断は肯定されるため、ステップS114に再度移行することになる。したがって、入力受付部20は、ステップS114、S120のいずれかの判断が肯定されるまで待機する。なお、ユーザは、図9(b)に示す検索ワード群「アセトン 海外 有用性試験」で検索を行いたい場合には、「検索」ボタンを押し、検索ワードを更に変換したい場合には、「履歴から変換」ボタンを押す。
Next, in step S114, the
ユーザが「検索」ボタンを押した場合、ステップS120の判断が肯定されるため、ステップS122に移行する。ステップS122に移行すると、検索実行部24は、図9(b)に示す検索ワード群「アセトン 海外 有用性試験」を用いてドキュメントDB40を検索し、検索結果を表示する。
When the user presses the "search" button, the determination in step S120 is affirmed, so the process proceeds to step S122. When the process proceeds to step S122, the
一方、ユーザが「履歴から変換」ボタンを押した場合には、ステップS114の判断が肯定されるため、ステップS116に移行する。ステップS116に移行すると、検索ワード変換部22が、1つの検索ワード以外の検索ワードを固定する。この場合、検索ワード変換部22は、1つの検索ワード以外の検索ワードを検索の軸として固定し、固定しない1つの検索ワードを変換対象として設定する。例えば、「アセトン」と「有用性試験」を比較すると、「アセトン」の方が特徴的であり、文書検索において重要かつ有用な検索ワードであるため、検索ワードから除外しないようにする必要がある。したがって、本実施形態では、検索ワード変換部22は、有用な検索ワードを固定するため、TF-IDFテーブル48に格納されている各ワードのIDF値を用いることとしている。
On the other hand, when the user presses the "convert from history" button, the determination in step S114 is affirmed, so the process proceeds to step S116. When the process proceeds to step S116, the search
例えば、検索ワード群が「アセトン 海外 有用性試験」である場合、検索ワード変換部22は、TF-IDFテーブル48を参照して、3つの検索ワードのうちIDF値が最も小さいワード以外を固定する。このようにすることで、普遍的に用いない(多くの文書で汎用されない)固有名詞のようなワード(IDF値が大きくなる傾向にあるワード)を検索ワードとして固定することができる。なお、上記例では、「アセトン 海外 有用性試験」のうち、「アセトン」と「海外」が固定されたものとする。
For example, when the search word group is "acetone overseas usefulness test", the search
次いで、ステップS118では、検索ワード変換部22が、固定されていない検索ワードを、ユーザと同部門の有識者の検索履歴に基づいて変換する。具体的には、検索ワード変換部22は、検索履歴テーブル44を参照し、ユーザと同部門の有識者の検索履歴から、ステップS116で固定した検索ワードが全て含まれる検索履歴(検索ワード群)を抽出する。ここでは、例えば、「アセトン 海外 使用制限」や「アセトン 海外 使用例」や「アセトン 海外 使用例 中国」が抽出されたとする。この場合、「アセトン 海外」以外のワード「使用制限」、「使用例」、「使用例 中国」が、「有用性試験」と変換する候補のワード(変換候補のワード)となる。
Next, in step S118, the search
次いで、検索ワード変換部22は、TF-IDFテーブル48を参照して、固定した検索ワード以外のワード(変換候補のワード)のTF-IDF値の分散を抽出する。変換候補のワードが「使用制限」であれば「使用制限」のTF-IDF値の分散をTF-IDFテーブル48から抽出する。また、変換候補のワードが「使用例」であれば「使用例」のTF-IDF値の分散をTF-IDFテーブル48から抽出する。また、変換候補のワードが「使用例 中国」であれば、「使用例」のTF-IDF値の分散と「中国」のTF-IDF値の分散をTF-IDFテーブル48から抽出して、その平均値を変換候補のワード「使用例 中国」のTF-IDF値の分散とする。
Next, the search
そして、検索ワード変換部22は、「使用制限」、「使用例」、「使用例 中国」のうち、TF-IDF値の分散が最も大きいものを固定していない検索ワードと代えて用いることとする。このように、TF-IDF値の分散が大きいワードを検索ワードとして用いる理由は、TF-IDF値の分散が大きいワードほど、文書の分類に貢献しているワードであると考えられるからである。上記例において、例えば「使用制限」のTF-IDF値の分散が最も大きければ、検索ワード変換部22は、図9(c)に示すように、図9(b)の検索ワード群「アセトン 海外 有用性試験」を「アセトン 海外 使用制限」に変換する。その後は、ステップS120に移行する。
Then, the search
ステップS116、S118を経てステップS120に移行した後、ユーザによって「検索」ボタンが押されると、ステップS122に移行し、検索実行部24は、図9(c)に示す検索ワード群「アセトン 海外 使用制限」を用いてドキュメントDB40を検索し、検索結果を表示する。
After shifting to step S120 via steps S116 and S118, when the "search" button is pressed by the user, the process proceeds to step S122, and the
ステップS122の後は、ステップS124に移行し、入力受付部20は、図6のステップS14と同様、検索結果の1つがユーザ端末70において選択されるまで待機する。ユーザ端末70において、ユーザが検索結果の中から1つの文書を選択すると、入力受付部20は、その旨を入力受付部20が提供部26に通知し、ステップS126に移行する。ステップS126では、提供部26は、図6のステップS16と同様、選択された文書の概要を示す画面をユーザ端末70に対して送信する(図7(b)参照)。
After step S122, the process proceeds to step S124, and the
次いで、ステップS128では、入力受付部20が、図6のステップS18と同様、ユーザ端末70において、ユーザにより図7(b)の画面において「ダウンロード」ボタンが押されるまで待機する。ユーザ端末70においてユーザにより「ダウンロード」ボタンが押されると、入力受付部20は、その旨を提供部26に通知し、ステップS130に移行する。ステップS130に移行すると、提供部26は、図6のステップS20と同様、ドキュメントDB40から選択された文書のデータを読み出し、ユーザ端末70に送信することで、ダウンロードを実行する。
Next, in step S128, the
以上により、図8の全処理が終了する。なお、図8の処理は、ユーザから図9(a)の検索画面(初心者用)を用いた検索要求が出されるたびに、繰り返し実行される。 With the above, all the processing of FIG. 8 is completed. The process of FIG. 8 is repeatedly executed every time the user issues a search request using the search screen (for beginners) of FIG. 9 (a).
なお、本実施形態では、上述したように、「履歴から変換」ボタンが押された場合に、検索ワード変換部22は、固定していない検索ワードを変換した結果を検索画面(初心者用)に表示する場合について説明した。しかしながら、これに限られるものではない。例えば、図10(a)に示すように「アセトン 海外 有用性試験」が検索ワード群として設定されている状態で、「履歴から変換」ボタンが押されたとする。このとき、固定されていない検索ワード「有用性試験」の変換候補ワードが複数抽出された場合には、図10(b)に示すように、各変換候補のワードで変換した後の検索ワード群を選択可能に表示するようにしてもよい。ユーザは、表示された検索ワード群のいずれか(例えば「アセトン 海外 使用制限」)を選択することで、図10(c)に示すように、検索に用いる検索ワード群を変更することができる。なお、図10(b)においては、例えば、変換候補のワードのTF-IDF値の分散が大きいものから順に、上から表示することができる。これにより、検索ワード変換部22が適切と判断したな検索ワード群ほど上位に(ユーザの目につきやすく)表示することができる。
In this embodiment, as described above, when the "Convert from history" button is pressed, the search
なお、本実施形態では、検索ワードが1つであっても「履歴から変換」ボタンを押すことができるものとする。例えば、検索ワードとして「アセトン」が設定されている状態で、ユーザが「履歴から変換」ボタンを押したとする。この場合、検索ワード変換部22は、検索ワード「アセトン」を固定して、ユーザと同部門の有識者の検索履歴から、固定した検索ワード「アセトン」が含まれる検索履歴を抽出する。そして、検索ワード変換部22は、TF-IDFテーブル48を参照して、固定した検索ワード「アセトン」以外のワードのTF-IDF値の分散を抽出し、TF-IDF値の分散が最も大きいものを検索ワードに追加する。このようにすることで、ユーザが入力した検索ワードが1つの場合に、適切な検索ワードを追加した上で検索を行うことが可能となる。
In this embodiment, even if there is only one search word, the "convert from history" button can be pressed. For example, suppose that the user presses the "Convert from history" button while "Acetone" is set as the search word. In this case, the search
なお、これまでの説明から明らかなように、本実施形態では、入力受付部20により、複数のユーザのそれぞれに対応する検索条件を受け付ける検索条件受付部、及び複数のユーザそれぞれに対応する検索結果に関する評価の入力を受け付ける評価受付部、としての機能が実現されている。また、検索ワード変換部22と検索実行部24とにより、評価が高いユーザとは異なるユーザに対応する検索条件を受け付けた場合に、評価が高いユーザの検索履歴に基づいて検索条件を変換し、変換して得られた検索条件による検索を実行する検索部としての機能が実現されている。
As is clear from the above description, in the present embodiment, the
以上、詳細に説明したように、本実施形態によると、入力受付部20が、検索画面において複数のユーザが入力した検索ワードを受け付けるとともに(S10:肯定)、検索評価画面において複数のユーザが入力した検索結果に関する評価を受け付け(S24:肯定)、評価部28が、受け付けた評価が高いユーザを「有識者」として特定する(S26)。そして、入力受付部20が、有識者とは異なるユーザが検索画面(初心者用)において入力した検索ワードを受け付けた場合に(S102:肯定)、検索ワード変換部22が、有識者の検索履歴に基づいて検索ワードを変換し(S106~S118)、検索実行部24が、変換後の検索ワードを用いた検索を実行する(S122)。これにより、本実施形態では、有識者の検索履歴に基づいて、有識者以外のユーザが入力した検索ワードをより適切な検索ワードに変換した上で検索を実行することができるため、検索精度を向上することが可能となる。また、ユーザは、必要な文書を探し出すまで、検索ワードの一部を変更して検索を実行するという作業を繰り返す必要がなくなるため、検索に要する労力を低減し、検索に要する時間を削減することができる。また、検索ワードが自動的に変換されることで、ユーザは、有識者であればどのような検索ワードを設定するかを容易に知ることができる。これにより、ユーザの業務能力の向上を図ることが可能となる。
As described in detail above, according to the present embodiment, the
また、本実施形態では、検索ワード変換部22は、ステップS110やS118において検索を行うユーザと同一部門の有識者の検索履歴を用いることとしている。これにより、ユーザが参考にすべき知識を有する有識者の検索履歴に基づいて、ユーザが設定した検索ワードを適切な検索ワードに変換することができる。
Further, in the present embodiment, the search
また、本実施形態では、検索ワード変換部22は、ユーザによって「類義語変換」ボタンが押された場合に、各検索ワードの類義語(類似ワード)を類義語辞書DB45から抽出し、検索ワードとその類義語のうち、同部門の有識者の検索履歴における出現頻度が最も高いものを検索ワードとする。これにより、ユーザが検索したい内容を変えることなく、入力した検索ワードを部門内でよく使われる検索に適した検索ワードに変換することができる。
Further, in the present embodiment, the search
また、本実施形態では、検索ワード変換部22は、ユーザによって「履歴から変換」ボタンが押されると、1つの検索ワード以外の検索ワードをIDF値に基づいて固定し、検索の軸として設定する(S116)。これにより、検索の方向性を固定したうえで、固定しない検索ワードを適切な検索ワードに変換することが可能となる。
Further, in the present embodiment, when the "convert from history" button is pressed by the user, the search
また、本実施形態では、検索ワード変換部22は、固定された検索ワードに基づいて、検索履歴テーブル44から固定されていない検索ワードの変換候補のワードを特定し、特定された変換候補のワードのうちTF-IDF値の分散が最大のもので、固定されていない検索ワードを変換する(S118)。これにより、変換候補のワードのうち、文書の分類に貢献している適切なワードで検索ワードを変換することができる。
Further, in the present embodiment, the search
なお、上記実施形態では、図9(b)に示すように「アセトン 海外 有用性試験」が検索ワード群として設定された状態から「履歴から変換」ボタンが押された場合に、検索ワードを固定する方法として、IDF値を利用する例について説明した。しかしながら、これに限られるものではなく、例えば、検索ワード変換部22は、検索ワードを固定する際に、専門用語を格納した専門用語辞典DBを更に参照するようにしてもよい。具体的には、検索ワード変換部22は、検索ワード群「アセトン 海外 有用性試験」のうち、専門用語辞典DBに含まれているワード(例えばアセトン)を固定する。その後、検索ワード変換部22は、検索ワード「海外」、「有用性試験」のうち、IDF値が最も小さいワード以外を固定する。このようにすることで、専門用語を必ず固定するようにした上で、固定されていない検索ワードをより適切なワードに変換することができるため、検索精度を向上することが可能となる。なお、IDF値を用いずに、専門用語辞書DBのみを用いて検索ワードを固定するようにしてもよい。
In the above embodiment, as shown in FIG. 9B, the search word is fixed when the "Convert from history" button is pressed from the state where the "Acetone overseas usefulness test" is set as the search word group. As a method of using the IDF value, an example of using the IDF value has been described. However, the present invention is not limited to this, and for example, the search
なお、上記実施形態では、ステップS110やS118において、部門ごとの出現頻度や検索履歴を用いる場合について説明したが、これに限られるものではない。すなわち、部門を考慮せず、会社全体の出現頻度や検索履歴を用いることとしてもよい。 In the above embodiment, the case where the appearance frequency and the search history for each department are used in steps S110 and S118 has been described, but the present invention is not limited to this. That is, the frequency of appearance and the search history of the entire company may be used without considering the department.
なお、上記実施形態では、ステップS116において、IDF値が最も小さい検索ワード以外の検索ワードを固定する場合について説明したが、これに限らず、例えば、IDF値が所定の閾値よりも大きい検索ワードを固定するようにしてもよい。また、固定する検索ワードの数の上限を定めるようにしてもよい。 In the above embodiment, the case where the search word other than the search word having the smallest IDF value is fixed has been described in step S116, but the present invention is not limited to this, and for example, a search word having an IDF value larger than a predetermined threshold value is used. It may be fixed. Further, the upper limit of the number of fixed search words may be set.
なお、上記実施形態では、検索ワード変換部22が、ステップS116において検索ワードを変換する際に、TF-IDF値の分散を用いることとしたが、これに限られるものではない。例えば、検索ワード変換部22は、ステップS116において、文書毎に求められるTF値の分散を用いることとしてもよい。
In the above embodiment, the search
なお、上記実施形態では、ユーザテーブル42に格納されている評価平均値に基づいて、自動的に「有識者」と「一般」を区別する場合について説明したが、これに限られるものではない。例えば、「有識者」と「一般」を管理者等が手入力により区別することとしてもよい。 In the above embodiment, the case where "expert" and "general" are automatically distinguished based on the evaluation average value stored in the user table 42 has been described, but the present invention is not limited to this. For example, an administrator or the like may manually distinguish between "intellectual" and "general".
なお、上記実施形態では、扱う業務が共通しており、検索傾向が類似する部門がある場合に、それらの部門を予め関連付けておいてもよい。この場合、異なる部門であっても、ステップS110やS118において同一の部門として取り扱うようにしてもよい。 In addition, in the above-described embodiment, when there are departments that are handled in common and have similar search tendencies, those departments may be associated in advance. In this case, even if they are different departments, they may be treated as the same department in steps S110 and S118.
なお、上記実施形態では、図7(a)の画面と図9(a)の画面をユーザが選択できる場合について説明したが、これに限られるものではない。例えば、入力受付部20は、検索を行うユーザが「有識者」か「一般」かをユーザテーブル42に基づいて判断し、「有識者」であれば、図7(a)の画面をユーザ端末70に送信し、「一般」であれば、図9(a)の画面をユーザ端末70に送信することとしてもよい。また、検索画面としては、図9(a)の画面のみを用意することとしてもよい。この場合、図9(a)の画面において、ユーザが「類義語変換」ボタンや「履歴から変換」ボタンを押さずに、「検索」ボタンを押した場合に、図6の処理を行うようにし、ユーザが「類義語変換」ボタンや「履歴から変換」ボタンを押した場合に、図8のステップS106以降の処理を行うようにしてもよい。
In the above embodiment, the case where the screen of FIG. 7A and the screen of FIG. 9A can be selected by the user has been described, but the present invention is not limited to this. For example, the
なお、上記実施形態では、検索処理システム100が会社内で利用される場合について説明したが、これに限られるものではない。会社内に限らず、学校等で用いることとしてもよいし、予め定めたグループ内で用いることとしてもよい。また、検索処理システム100の利用範囲を会社や学校等に限定しないこととしてもよい。
In the above embodiment, the case where the
なお、上記実施形態では、文書を検索する際の検索ワードを検索結果に関する評価が高いユーザの検索履歴に基づいて変換する場合について説明したが、これに限られるものではない。すなわち、何らかの情報を検索する場合に、入力された検索条件を検索結果に関する評価が高いユーザの検索履歴に基づいて変換することとしてもよい。 In the above embodiment, the case where the search word when searching the document is converted based on the search history of the user who has a high evaluation regarding the search result has been described, but the present invention is not limited to this. That is, when searching for some information, the input search condition may be converted based on the search history of a user who has a high evaluation regarding the search result.
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体(ただし、搬送波は除く)に記録しておくことができる。 The above processing function can be realized by a computer. In that case, a program that describes the processing content of the function that the processing device should have is provided. By executing the program on a computer, the above processing function is realized on the computer. The program describing the processing content can be recorded on a computer-readable recording medium (however, the carrier wave is excluded).
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD-ROM(Compact Disc Read Only Memory)などの可搬型記録媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。 When a program is distributed, it is sold in the form of a portable recording medium such as a DVD (Digital Versatile Disc) or a CD-ROM (Compact Disc Read Only Memory) on which the program is recorded. It is also possible to store the program in the storage device of the server computer and transfer the program from the server computer to another computer via the network.
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。 The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes the processing according to the program. The computer can also read the program directly from the portable recording medium and execute the processing according to the program. In addition, the computer can sequentially execute processing according to the received program each time the program is transferred from the server computer.
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。 The embodiments described above are examples of preferred embodiments of the present invention. However, the present invention is not limited to this, and various modifications can be made without departing from the gist of the present invention.
なお、以上の実施形態の説明に関して、更に以下の付記を開示する。
(付記1) 複数のユーザのそれぞれに対応する検索条件を受け付け、
前記複数のユーザそれぞれに対応する検索結果に関する評価の入力を受け付け、
前記評価が高いユーザを特定し、
前記評価が高いユーザとは異なるユーザに対応する検索条件を受け付けた場合に、前記評価が高いユーザの検索履歴に基づいて前記検索条件を変換し、変換して得られた検索条件による検索を実行する、
処理をコンピュータに実行させることを特徴とする検索処理プログラム。
(付記2) 前記評価が高いユーザとは異なるユーザは、前記評価が高いユーザと同一の業務に従事するユーザであることを特徴とする付記1に記載の検索処理プログラム。
(付記3) 前記検索条件は、検索ワードを含み、
前記検索条件を変換する場合、前記検索ワードに類似する類似ワードを特定し、前記類似ワードのうち前記評価が高いユーザが検索に利用した頻度が高いものを優先して、前記検索ワードと変換する、
ことを特徴とする付記1又は2に記載の検索処理プログラム。
(付記4) 前記検索条件は、複数の検索ワードを組み合わせた検索ワード群を含み、
前記検索条件を変換する場合、前記検索ワード群から変換を行わない検索ワードと変換対象の検索ワードとを特定し、特定した前記変換対象の検索ワードを、前記評価が高いユーザの検索履歴に基づいて変換する、
ことを特徴とする付記1~3のいずれかに記載の検索処理プログラム。
(付記5) 前記検索を実行する処理は、複数の文書の中から前記検索ワード群を含む文書を検索する処理であり、
前記検索ワード群に含まれる複数の検索ワードのうち、前記複数の文書におけるIDF(Inverse Document Frequency)値が小さいものを優先して、前記変換を行わない検索ワードとして特定する、
ことを特徴とする付記4に記載の検索処理プログラム。
(付記6) 前記変換対象の検索ワードを変換する場合、前記変換を行わない検索ワードを含む検索ワード群を前記評価が高いユーザの検索履歴から抽出し、抽出した前記検索ワード群に基づいて、前記変換対象の検索ワードを変換する、
ことを特徴とする付記5に記載の検索処理プログラム。
(付記7) 前記変換対象の検索ワードを変換する場合、抽出した前記検索ワード群に含まれる前記変換を行わない検索ワード以外の検索ワードのうち、前記複数の文書それぞれにおけるTF(Term Frequency)-IDF値の分散が大きいものを優先して、前記変換対象の検索ワードと変換する、
ことを特徴とする付記6に記載の検索処理プログラム。
(付記8) 複数のユーザのそれぞれに対応する検索条件を受け付け、
前記複数のユーザそれぞれに対応する検索結果に関する評価の入力を受け付け、
前記評価が高いユーザを特定し、
前記評価が高いユーザとは異なるユーザに対応する検索条件を受け付けた場合に、前記評価が高いユーザの検索履歴に基づいて前記検索条件を変換し、変換して得られた検索条件による検索を実行する、
処理をコンピュータが実行することを特徴とする検索処理方法。
(付記9) 複数のユーザのそれぞれに対応する検索条件を受け付ける検索条件受付部と、
前記複数のユーザそれぞれに対応する検索結果に関する評価の入力を受け付ける評価受付部と、
前記評価が高いユーザを特定する特定部と、
前記評価が高いユーザとは異なるユーザに対応する検索条件を受け付けた場合に、前記評価が高いユーザの検索履歴に基づいて前記検索条件を変換し、変換して得られた検索条件による検索を実行する検索部と、
を備える検索処理装置。
(付記10) 前記評価が高いユーザとは異なるユーザは、前記評価が高いユーザと同一の業務に従事するユーザであることを特徴とする付記9に記載の検索処理装置。
(付記11) 前記検索条件は、検索ワードを含み、
前記検索部は、前記検索ワードに類似する類似ワードを特定し、前記類似ワードのうち前記評価が高いユーザが検索に利用した頻度が高いものを優先して、前記検索ワードと変換する、
ことを特徴とする付記9又は10に記載の検索処理装置。
(付記12) 前記検索条件は、複数の検索ワードを組み合わせた検索ワード群を含み、
前記検索部は、前記検索ワード群から変換を行わない検索ワードと変換対象の検索ワードとを特定し、特定した前記変換対象の検索ワードを、前記評価が高いユーザの検索履歴に基づいて変換する、
ことを特徴とする付記9~11のいずれかに記載の検索処理装置。
(付記13) 前記検索部は、複数の文書の中から前記検索ワード群を含む文書を検索し、
前記検索ワード群に含まれる複数の検索ワードのうち、前記複数の文書におけるIDF値が小さいものを優先して、前記変換を行わない検索ワードとして特定する、
ことを特徴とする付記12に記載の検索処理装置。
(付記14) 前記検索部は、前記変換を行わない検索ワードを含む検索ワード群を前記評価が高いユーザの検索履歴から抽出し、抽出した前記検索ワード群に基づいて、前記変換対象の検索ワードを変換する、
ことを特徴とする付記13に記載の検索処理装置。
(付記15) 前記検索部は、抽出した前記検索ワード群に含まれる前記変換を行わない検索ワード以外の検索ワードのうち、前記複数の文書それぞれにおけるTF-IDF値の分散が大きいものを優先して、前記変換対象の検索ワードと変換する、
ことを特徴とする付記14に記載の検索処理装置。
The following additional notes will be further disclosed with respect to the description of the above embodiments.
(Appendix 1) Accepting search conditions corresponding to each of multiple users,
Accepts input of evaluation regarding search results corresponding to each of the plurality of users,
Identify the users with high ratings and
When a search condition corresponding to a user different from the user with a high evaluation is accepted, the search condition is converted based on the search history of the user with a high evaluation, and a search based on the converted search condition is executed. do,
A search processing program characterized by having a computer execute the processing.
(Supplementary Note 2) The search processing program according to Supplementary Note 1, wherein a user different from the user having a high evaluation is a user engaged in the same business as the user having a high evaluation.
(Appendix 3) The search condition includes a search word and includes a search word.
When converting the search condition, a similar word similar to the search word is specified, and among the similar words, the one frequently used for the search by the user with a high evaluation is prioritized and converted into the search word. ,
The search processing program according to Appendix 1 or 2, characterized in that.
(Appendix 4) The search condition includes a search word group in which a plurality of search words are combined.
When converting the search condition, the search word that is not converted and the search word to be converted are specified from the search word group, and the specified search word to be converted is based on the search history of the user having a high evaluation. To convert,
The search processing program according to any one of Supplementary Provisions 1 to 3, characterized in that.
(Appendix 5) The process of executing the search is a process of searching a document including the search word group from a plurality of documents.
Among the plurality of search words included in the search word group, those having a small IDF (Inverse Document Frequency) value in the plurality of documents are prioritized and specified as the search words that are not converted.
The search processing program according to
(Appendix 6) When converting the search word to be converted, a search word group including the search word not to be converted is extracted from the search history of the user having a high evaluation, and based on the extracted search word group, the search word group is extracted. Converting the search word to be converted,
The search processing program according to Appendix 5, characterized in that.
(Appendix 7) When converting the search word to be converted, TF (Term Frequency) in each of the plurality of documents among the search words other than the search words not to be converted included in the extracted search word group. Priority is given to those having a large variance of IDF values, and the search words to be converted are converted.
The search processing program according to Appendix 6, characterized in that.
(Appendix 8) Accepting search conditions corresponding to each of multiple users,
Accepts input of evaluation regarding search results corresponding to each of the plurality of users,
Identify the users with high ratings and
When a search condition corresponding to a user different from the user with a high evaluation is accepted, the search condition is converted based on the search history of the user with a high evaluation, and a search based on the converted search condition is executed. do,
A search processing method characterized by the processing being performed by a computer.
(Appendix 9) A search condition reception unit that accepts search conditions corresponding to each of a plurality of users,
An evaluation reception unit that accepts input of evaluations related to search results corresponding to each of the plurality of users, and
A specific part that identifies a user with a high evaluation,
When a search condition corresponding to a user different from the user with a high evaluation is accepted, the search condition is converted based on the search history of the user with a high evaluation, and a search based on the converted search condition is executed. Search section and
A search processing device.
(Supplementary Note 10) The search processing apparatus according to
(Appendix 11) The search condition includes a search word and includes a search word.
The search unit identifies similar words similar to the search word, gives priority to those similar words that are frequently used by the user with a high evaluation in the search, and converts them into the search word.
The search processing apparatus according to
(Appendix 12) The search condition includes a search word group in which a plurality of search words are combined.
The search unit identifies a search word that is not converted and a search word to be converted from the search word group, and converts the identified search word to be converted based on the search history of the user with a high evaluation. ,
The search processing apparatus according to any one of
(Appendix 13) The search unit searches for a document containing the search word group from a plurality of documents, and searches for a document containing the search word group.
Of the plurality of search words included in the search word group, those having a small IDF value in the plurality of documents are prioritized and specified as the search word that does not perform the conversion.
The search processing apparatus according to Appendix 12, wherein the search processing apparatus is characterized in that.
(Appendix 14) The search unit extracts a search word group including the search word that is not converted from the search history of the user having a high evaluation, and based on the extracted search word group, the conversion target search word. To convert,
The search processing apparatus according to Appendix 13, wherein the search processing apparatus is described.
(Appendix 15) Among the search words included in the extracted search word group other than the search words that are not converted, the search unit gives priority to those having a large dispersion of TF-IDF values in each of the plurality of documents. And convert it to the search word to be converted.
The search processing apparatus according to Appendix 14, wherein the search processing apparatus is described.
10 サーバ(検索処理装置)
20 入力受付部(検索条件受付部、評価受付部)
22 検索ワード変換部(検索部の一部)
24 検索実行部(検索部の一部)
28 評価部(特定部)
10 Server (search processing device)
20 Input reception department (search condition reception department, evaluation reception department)
22 Search word conversion unit (part of the search unit)
24 Search execution section (part of the search section)
28 Evaluation Department (Specific Department)
Claims (9)
前記複数のユーザそれぞれに対応する検索結果に関する評価の入力を受け付け、
受け付けた前記評価を演算処理した結果から前記評価が高いユーザを特定し、
前記評価が高いユーザとは異なるユーザに対応する検索条件を受け付けた場合に、前記評価が高いユーザの検索履歴に基づいて前記検索条件を変換し、変換して得られた検索条件による検索を実行する、
処理をコンピュータに実行させることを特徴とする検索処理プログラム。 Accepts search conditions corresponding to each of multiple users,
Accepts input of evaluation regarding search results corresponding to each of the plurality of users,
A user with a high evaluation is identified from the result of arithmetic processing of the received evaluation .
When a search condition corresponding to a user different from the user with a high evaluation is accepted, the search condition is converted based on the search history of the user with a high evaluation, and a search based on the converted search condition is executed. do,
A search processing program characterized by having a computer execute the processing.
前記検索条件を変換する場合、前記検索ワードに類似する類似ワードを特定し、前記類似ワードのうち前記評価が高いユーザが検索に利用した頻度が高いものを優先して、前記検索ワードと変換する、
ことを特徴とする請求項1又は2に記載の検索処理プログラム。 The search condition includes a search word and includes
When converting the search condition, a similar word similar to the search word is specified, and among the similar words, the one frequently used for the search by the user with a high evaluation is prioritized and converted into the search word. ,
The search processing program according to claim 1 or 2.
前記検索条件を変換する場合、前記検索ワード群から変換を行わない検索ワードと変換対象の検索ワードとを特定し、特定した前記変換対象の検索ワードを、前記評価が高いユーザの検索履歴に基づいて変換する、
ことを特徴とする請求項1~3のいずれか一項に記載の検索処理プログラム。 The search condition includes a search word group in which a plurality of search words are combined.
When converting the search condition, the search word that is not converted and the search word to be converted are specified from the search word group, and the specified search word to be converted is based on the search history of the user having a high evaluation. To convert,
The search processing program according to any one of claims 1 to 3, wherein the search processing program is characterized in that.
前記検索ワード群に含まれる複数の検索ワードのうち、前記複数の文書におけるIDF(Inverse Document Frequency)値が大きいものを優先して、前記変換を行わない検索ワードとして特定する、
ことを特徴とする請求項4に記載の検索処理プログラム。 The process of executing the search is a process of searching a document including the search word group from a plurality of documents.
Among the plurality of search words included in the search word group, those having a large IDF (Inverse Document Frequency) value in the plurality of documents are prioritized and specified as the search words that are not converted.
The search processing program according to claim 4.
ことを特徴とする請求項5に記載の検索処理プログラム。 When converting the search word to be converted, a search word group including the search word not to be converted is extracted from the search history of the user having a high evaluation, and the conversion target is based on the extracted search word group. Convert search words,
The search processing program according to claim 5.
ことを特徴とする請求項6に記載の検索処理プログラム。 When converting the search word to be converted, the distribution of the TF (Term Frequency) -IDF value in each of the plurality of documents among the search words other than the search words not to be converted included in the extracted search word group. Priority is given to those with a large value, and the search word to be converted is converted.
The search processing program according to claim 6.
前記複数のユーザそれぞれに対応する検索結果に関する評価の入力を受け付け、
受け付けた前記評価を演算処理した結果から前記評価が高いユーザを特定し、
前記評価が高いユーザとは異なるユーザに対応する検索条件を受け付けた場合に、前記評価が高いユーザの検索履歴に基づいて前記検索条件を変換し、変換して得られた検索条件による検索を実行する、
処理をコンピュータが実行することを特徴とする検索処理方法。 Accepts search conditions corresponding to each of multiple users,
Accepts input of evaluation regarding search results corresponding to each of the plurality of users,
A user with a high evaluation is identified from the result of arithmetic processing of the received evaluation .
When a search condition corresponding to a user different from the user with a high evaluation is accepted, the search condition is converted based on the search history of the user with a high evaluation, and a search based on the converted search condition is executed. do,
A search processing method characterized by the processing being performed by a computer.
前記複数のユーザそれぞれに対応する検索結果に関する評価の入力を受け付ける評価受付部と、
受け付けた前記評価を演算処理した結果から前記評価が高いユーザを特定する特定部と、
前記評価が高いユーザとは異なるユーザに対応する検索条件を受け付けた場合に、前記評価が高いユーザの検索履歴に基づいて前記検索条件を変換し、変換して得られた検索条件による検索を実行する検索部と、
を備える検索処理装置。 A search condition reception unit that accepts search conditions corresponding to each of multiple users,
An evaluation reception unit that accepts input of evaluations related to search results corresponding to each of the plurality of users, and
A specific unit that identifies a user with a high evaluation from the result of arithmetic processing of the received evaluation , and
When a search condition corresponding to a user different from the user with a high evaluation is accepted, the search condition is converted based on the search history of the user with a high evaluation, and a search based on the converted search condition is executed. Search section and
A search processing device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018020734A JP7091685B2 (en) | 2018-02-08 | 2018-02-08 | Search processing program, search processing method and search processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018020734A JP7091685B2 (en) | 2018-02-08 | 2018-02-08 | Search processing program, search processing method and search processing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019139413A JP2019139413A (en) | 2019-08-22 |
JP7091685B2 true JP7091685B2 (en) | 2022-06-28 |
Family
ID=67694068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018020734A Active JP7091685B2 (en) | 2018-02-08 | 2018-02-08 | Search processing program, search processing method and search processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7091685B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7530339B2 (en) | 2021-08-04 | 2024-08-07 | 株式会社トヨタマップマスター | CONVERSION DEVICE, CONVERSION METHOD, CONVERSION PROGRAM, AND STORAGE MEDIUM |
WO2023119573A1 (en) * | 2021-12-23 | 2023-06-29 | 日本電気株式会社 | Information processing device, information processing system, information processing method, and program |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003323205A (en) | 2002-05-01 | 2003-11-14 | Sumitomo Wiring Syst Ltd | Cutting and pressing production simulating device, and program |
JP2005071002A (en) | 2003-08-22 | 2005-03-17 | Ricoh Co Ltd | Common search system, program, and recording medium |
JP2005099884A (en) | 2000-07-06 | 2005-04-14 | Takashi Miyake | Retrieving device |
JP2008203997A (en) | 2007-02-16 | 2008-09-04 | Toshiba Corp | Document retrieval device and program |
US20080319976A1 (en) | 2007-06-23 | 2008-12-25 | Microsoft Corporation | Identification and use of web searcher expertise |
US20090144262A1 (en) | 2007-12-04 | 2009-06-04 | Microsoft Corporation | Search query transformation using direct manipulation |
US20170364585A1 (en) | 2015-06-15 | 2017-12-21 | Naver Corporation | Search service providing device, method, and computer program |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06314296A (en) * | 1993-03-02 | 1994-11-08 | Fujitsu Ltd | Information retrieving system |
-
2018
- 2018-02-08 JP JP2018020734A patent/JP7091685B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005099884A (en) | 2000-07-06 | 2005-04-14 | Takashi Miyake | Retrieving device |
JP2003323205A (en) | 2002-05-01 | 2003-11-14 | Sumitomo Wiring Syst Ltd | Cutting and pressing production simulating device, and program |
JP2005071002A (en) | 2003-08-22 | 2005-03-17 | Ricoh Co Ltd | Common search system, program, and recording medium |
JP2008203997A (en) | 2007-02-16 | 2008-09-04 | Toshiba Corp | Document retrieval device and program |
US20080319976A1 (en) | 2007-06-23 | 2008-12-25 | Microsoft Corporation | Identification and use of web searcher expertise |
US20090144262A1 (en) | 2007-12-04 | 2009-06-04 | Microsoft Corporation | Search query transformation using direct manipulation |
US20170364585A1 (en) | 2015-06-15 | 2017-12-21 | Naver Corporation | Search service providing device, method, and computer program |
Non-Patent Citations (1)
Title |
---|
滝川 真弘,ノイズに頑健な分野別単語排他度の提案とTwitterユーザの専門性推定への適用,第9回データ工学と情報マネジメントに関するフォーラム (第15回日本データベース学会年次大会) [online] ,電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2017年02月27日,DEIM Forum 2017 D5-3,Internet<URL:https://db-event.jpn.org/deim2017/papers/273.pdf> |
Also Published As
Publication number | Publication date |
---|---|
JP2019139413A (en) | 2019-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7085761B2 (en) | Program for changing search results rank, recording medium for recording such a program, and content search processing method | |
JP5425140B2 (en) | System and method for providing search results | |
US9195378B2 (en) | Method, system and program for supporting input of execution parameter of predetermined software to input field | |
KR101301380B1 (en) | Ranking functions using a biased click distance of a document on a network | |
US20050165819A1 (en) | Document tabulation method and apparatus and medium for storing computer program therefor | |
JP4746439B2 (en) | Document search server and document search method | |
CN109857938B (en) | Searching method and searching device based on enterprise information and computer storage medium | |
JP7091685B2 (en) | Search processing program, search processing method and search processing device | |
US8666914B1 (en) | Ranking non-product documents | |
US20120130974A1 (en) | Search engine for ranking a set of pages returned as search results from a search query | |
JP6203304B2 (en) | Information processing apparatus, information processing method, and information processing program | |
JP2004178421A (en) | Document retrieval device, method for retrieving document, program, and recording medium | |
JP2011257786A (en) | Document retrieval system, information processor, document retrieval method and program | |
JP6640519B2 (en) | Information analysis device and information analysis method | |
JP2011248762A (en) | Classification device, content retrieval system, content classification method, content retrieval method, and program | |
Bachchhav | Information retrieval: search process, techniques and strategies | |
JPH11175552A (en) | Data base retrieving device and computer readable recording medium for storing data base retrieval program | |
JP6056327B2 (en) | Electronic commerce server device | |
JP2003016106A (en) | Device for calculating degree of association value | |
AU2021289542B2 (en) | Refining a search request to a content provider | |
JP2020149447A (en) | Display information generation device and program | |
JPH1139338A (en) | Document retrieval device and method therefor and medium recording program for document retrieval | |
US7720832B1 (en) | Dynamic contact information | |
JP2011210120A (en) | Device and method for retrieving multiple servers | |
JP2007241635A (en) | Document retrieval device, information processor, retrieval result output method, retrieval result display method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210922 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220517 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220530 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7091685 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |