JP5336779B2 - Information processing apparatus for performing character string conversion, character string conversion method, program, and information processing system - Google Patents
Information processing apparatus for performing character string conversion, character string conversion method, program, and information processing system Download PDFInfo
- Publication number
- JP5336779B2 JP5336779B2 JP2008168087A JP2008168087A JP5336779B2 JP 5336779 B2 JP5336779 B2 JP 5336779B2 JP 2008168087 A JP2008168087 A JP 2008168087A JP 2008168087 A JP2008168087 A JP 2008168087A JP 5336779 B2 JP5336779 B2 JP 5336779B2
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- character string
- original character
- conversion
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Description
本発明は、文字列変換技術に関し、より詳細には、元文字で記述された文字列を、アルファベットなど他の言語の文字列に変換する情報処理装置、文字列変換方法、プログラムおよび情報処理システムに関する。 The present invention relates to a character string conversion technique, and more specifically, an information processing apparatus, a character string conversion method, a program, and an information processing system for converting a character string described in original characters into a character string of another language such as an alphabet. About.
近年、経済活動のグローバル化、交通機関の発達、インターネットの普及などにより、日本語、英語、中国語、韓国語など複数の言語を同時的に処理しなければならい場合が多い。複数の言語を処理することが必要な業務は、数多く存在する。例えば、人名については、人名特有の単語も多く、また判断するための時間も限られている場合も多い。アルファベットなどインド・ヨーロッパ語圏の名称が例えばアルファベットで記述されている場合には、アルファベット変換の必要性はない。しかしながら、インド・ヨーロッパ語圏以外の言語に由来する人名や、インド・ヨーロッパ語圏の人名がそれ以外の言語、例えば日本語、中国語、韓国語で記述された後、日本語などの表記からアルファベットを生成する場合には、種々の問題が生じる。 In recent years, due to the globalization of economic activities, the development of transportation facilities, the spread of the Internet, etc., it is often necessary to process multiple languages such as Japanese, English, Chinese and Korean simultaneously. There are many tasks that require processing of multiple languages. For example, as for the name of a person, there are many words unique to the name of the person, and the time for determination is often limited. When names in the Indo-European-speaking area such as alphabets are described in alphabets, for example, there is no need for alphabet conversion. However, after a person's name derived from a language other than Indo-European-speaking languages, or after a name of an Indo-European-speaking person is written in another language, such as Japanese, Chinese, or Korean, Various problems arise when generating the alphabet.
例えば、日本語のカタカナは、表音文字であり、カナ表記で、「らいと」または「ライト」の文字列について、アルファベットに変換する場合について例示的に検討する。例えば、カタカナ表記「ライト」に対して、同一または類似のアルファベット表記は、“right”、“light”、“write”、“wright”など考えられるアルファベット表記は多数存在する。 For example, Japanese katakana is a phonetic character, and a case where a character string of “raito” or “light” in kana notation is converted into an alphabet will be considered as an example. For example, for the katakana notation “light”, there are many possible alphabet notations such as “right”, “light”, “write”, “wright” as the same or similar alphabet notation.
また、インド・ヨーロッパ語圏の人名を、カタカナとする場合には、例えば“Henry”について、英語の話者は、「ヘンリー」と発音し、カタカナ表記が与えられる。ところが、アルファベットで“Henry”と記述された場合、フランス語の話者は、「アンリ」と発音するので、オリジナルのアルファベット表示が同一にもかかわらず、異なるカタカナ表記が与えられる。このようなアルファベット表記が、カタカナ表記に変換され、さらにカタカナ表記を他者が、再度アルファベット表記に変換する場合、必ずしも一義的な変換が与えられるというわけではない。 When the name of an Indian / European-speaking person is katakana, for example, “Henry”, an English speaker pronounces “Henry” and is given katakana notation. However, when “Henry” is written in the alphabet, the French speaker pronounces “Henri”, so that different katakana notation is given even though the original alphabet display is the same. When such an alphabet notation is converted into a katakana notation, and when another person converts the katakana notation into an alphabet notation again, a unique conversion is not necessarily given.
また、言語上で使用される単語には、人名の他、地名、造語、合成語などを挙げることができる。これらの単語を都度辞書を参照してそのスペリングを調べることも可能ではある。しかしながら、電話などの音声コールでは、発音された単語に基づいてリアルタイムで処理しなければならない場合がほとんどで、都度辞書を引用して調べることが可能でない場合もあり、この結果、誤記、ヒアリングミスなどによるエラーが発生する場合もあった。 The words used in the language can include place names, coined words, synthesized words, etc. in addition to the names of people. It is also possible to check the spelling of these words by referring to the dictionary each time. However, voice calls such as telephone calls often require processing in real time based on the pronounced words, and it may not be possible to look up the dictionary by quoting each time. In some cases, errors may occur.
これまで上述したアルファベット変換を行うための技術も知られている。例えば、特開平8−339376号公報(特許文献1)では、データベースに登録された外国語単語をカタカナ単語で効率良く検索する装置およびシステムが開示されている。特許文献1では、発音記号とカタカナ文字との対応を記憶する発音記号・カタカナ対応テーブルと、登録データ入力部から入力された外国語単語および発音記号からなる登録データの発音記号を、発音記号・カタカナ対応テーブルを用いてカタカナ単語に変換する発音記号カタカナ変換手段とを使用する。特許文献1のシステムは、検索キーワードのカタカナ単語のデータベースに登録された各カタカナ単語に対する類似度Riを計算し、単語類似度Riが規定値以上のカタカナ単語に対応する外国語単語を検索結果として出力するものである。
上述したように特許文献1に記載された技術は、変換テーブルを使用してカタカナ外国語変換を行うものであるため、辞書メンテナンスの手間を要する。また、辞書精度によって、カタカナ−アルファベット変換の精度が左右されること、および単語類似度を、カタカナ同士の文字比較を使用して行うものであり、カタカナ表記の多様性や、アルファベット表記とカタカナに変換した場合に発音されない、すなわち黙字などの存在により同一のカタカナ表記となる場合など、充分な精度で変換できない場合もあった。
As described above, since the technique described in
上述した従来技術の不都合は、カタカナ同士の比較により、その類似度を計算することによるものである。また、検索キーワードを取得し、類似度を計算した後、類似度に応答して発音を参照し、外国語単語を検索するのでは、テーブルのために割当てるメモリなどのハードウェア資源の消費の点、検索時間などのマイクロプロセッサ占有時間、および検索精度の点からリアルタイム応答性を実現する上で充分なものということができなかった。 The inconvenience of the prior art described above is due to the calculation of the degree of similarity by comparison between katakana. In addition, after obtaining the search keyword and calculating the similarity, referring to the pronunciation in response to the similarity and searching for foreign language words, the consumption of hardware resources such as memory allocated for the table In view of the microprocessor occupation time such as the search time and the search accuracy, it cannot be said to be sufficient for realizing the real-time response.
本発明は、上述した従来技術の問題点に鑑みてなされたものであり、本発明は、カタカナ、平仮名、ハングルなどの元文字列と、アルファベットなどの他の言語とを直接関連付けることにより、元文字列をアルファベットなどの対応する他の言語の文字列に変換することを可能とする情報処理装置、文字列変換方法、プログラムおよび情報処理システムを提供することを目的とする。 The present invention has been made in view of the above-described problems of the prior art, and the present invention can be realized by directly associating original character strings such as katakana, hiragana, and hangul with other languages such as alphabets. It is an object of the present invention to provide an information processing apparatus, a character string conversion method, a program, and an information processing system that can convert a character string into a character string corresponding to another language such as an alphabet.
さらに本発明は、カタカナ、平仮名、ハングルなどの元文字列を、元文字列に対応する最尤のアルファベットといった他の言語の文字列に変換することが可能な情報処理装置、文字列変換方法、プログラムおよび情報処理システムを提供することを目的とする。 Furthermore, the present invention relates to an information processing apparatus capable of converting an original character string such as katakana, hiragana or hangul into a character string of another language such as a maximum likelihood alphabet corresponding to the original character string, a character string conversion method, An object is to provide a program and an information processing system.
さらに、本発明は、カタカナ、平仮名、ハングルなどの元文字列に対してアルファベットといった他の言語の音素を対応付け、確率モデルを使用して最尤のアルファベット文字列への変換を可能とする、情報処理装置、文字列変換方法、プログラムおよび情報処理システムを提供することを目的とする。 Furthermore, the present invention associates phonemes of other languages such as alphabets with original character strings such as katakana, hiragana, and hangul, and enables conversion to a maximum likelihood alphabet character string using a probability model. An object is to provide an information processing apparatus, a character string conversion method, a program, and an information processing system.
本発明は、上記従来技術の問題点に鑑みてなされたものであり、本発明では、元文字列の音素と、変換先文字列の音素との間の対応関係に対してコストを定義し、元文字列と変換先文字列との間の音素特性の相違を特徴付けるアライメント・コストを採用する。アライメント・コストは、元文字列と変換先文字列との間の言語学的な音素特性の相違を文字列変換に含ませることを可能とする。アライメント処理において、元文字列の音素シーケンスおよび変換先文字列の音素シーケンスは、それぞれを軸とする経路マップを生成するために使用される。経路マップでは、元文字列の単位音素と変換先文字列の対応付けられる単位音素とによりセルが定義される。そして、経路に対して、各軸に沿った方向および各軸に対して斜めの方向の3方向に対応する3つの単位経路を指定し、それぞれに対して異なるコストを付与し、経路マップ上での最短経路、すなわち、最小コスト経路を与えるように各コストを決定し、コスト・モデルを作成する。 The present invention has been made in view of the above problems of the prior art, and in the present invention, the cost is defined for the correspondence between the phoneme of the original character string and the phoneme of the conversion destination character string, Adopt an alignment cost that characterizes the difference in phoneme characteristics between the original string and the destination string. The alignment cost enables the character string conversion to include a linguistic phoneme characteristic difference between the original character string and the conversion target character string. In the alignment process, the phoneme sequence of the original character string and the phoneme sequence of the conversion destination character string are used to generate a route map around each axis. In the route map, a cell is defined by a unit phoneme of an original character string and a unit phoneme associated with a conversion destination character string. Then, for the route, three unit routes corresponding to three directions, that is, a direction along each axis and an oblique direction with respect to each axis are designated, and different costs are assigned to each. Each cost is determined so as to give the shortest path, that is, the minimum cost path, and a cost model is created.
作成されたコスト・モデルは、その後、未アライメント事例の自動アライメントに使用される。未アライメント事例の自動アライメントは、元文字列の音素シーケンスを決定し、元文字列の音素シーケンスに対応付けられる可能性のある変換先文字列の音素シーケンスとから複数の経路マップを生成し、最小コスト経路を探索する。探索された最小コスト経路は、元文字列に対する変換先文字列のアライメント結果を与える。なお、本発明では、経路探索を、ビタビ・アルゴリズムを使用して実行してもよい。 The created cost model is then used for automatic alignment of unaligned cases. Automatic alignment of unaligned cases determines the phoneme sequence of the original string, generates multiple path maps from the phoneme sequence of the destination string that may be associated with the phoneme sequence of the original string, and minimizes Search cost path. The searched minimum cost path gives the alignment result of the conversion destination character string with respect to the original character string. In the present invention, the route search may be performed using the Viterbi algorithm.
さらに本発明では、上述した自動アライメントの結果を使用して、元文字音素を観測系列とし、変換先文字列を状態遷移系列とする、確率モデルを生成する。確率モデルは、元文字音素と元文字に対応する変換先音素の変換確率πiと、元文字列のシーケンスに対応して後続する音素を、変換先音素に変換するための変換確率πjを与える遷移確率Pijとを、元文字音素または変換先文字列の音素に対応付けた遷移確率テーブルとして生成される。 Furthermore, in the present invention, using the result of the automatic alignment described above, a probability model is generated in which the original character phoneme is an observation sequence and the conversion destination character string is a state transition sequence. The probabilistic model includes a conversion probability π i of an original character phoneme and a conversion destination phoneme corresponding to the original character, and a conversion probability π j for converting a subsequent phoneme corresponding to the sequence of the original character string into a conversion destination phoneme. The given transition probability P ij is generated as a transition probability table in which the original character phoneme or the phoneme of the conversion destination character string is associated.
文字列変換処理を行う場合、元文字列を取得して、音素分解を行い、音素分解の結果および確率モデルを使用して元文字列から状態遷移により生成される他言語の文字列の変換尤度χを計算し、最大の変換尤度χを与える他言語の文字列を、文字列変換結果として出力することで、文字列変換を行う。 When performing character string conversion processing, the original character string is acquired, phoneme decomposed, and the conversion likelihood of the other language character string generated by state transition from the original character string using the result of phoneme decomposition and the probability model. Character string conversion is performed by calculating a degree χ and outputting a character string of another language that gives the maximum conversion likelihood χ as a character string conversion result.
また、確率モデルは、異なる言語に対応して複数使用することも可能であり、特定の元文字列から、言語種類を推定し、推定された言語への文字列変換を行うこともできる。 A plurality of probability models can be used corresponding to different languages, and a language type can be estimated from a specific original character string and a character string can be converted into the estimated language.
さらに、本発明では、上記の処理を情報処理装置に実行させるための情報処理実行可能な文字列変換方法およびプログラムを提供するものである。 Furthermore, the present invention provides a character string conversion method and program capable of information processing for causing the information processing apparatus to execute the above processing.
本発明は、ネットワークを介してウェブ・クライアントに対して文字列変換サービスを提供するウェブ・サーバとして実装することができる。 The present invention can be implemented as a web server that provides a character string conversion service to a web client via a network.
本発明によれば、元文字列と変換先の他言語との間の言語学的な音素分解の相違に柔軟に対応でき、さらに元文字列の音素と変換先文字列の音素とを直接変換することで、変換精度を向上させ、言語の多様性にも柔軟に対応でき、さらにハードウェア資源の浪費を伴わない、情報処理装置、文字列変換方法、プログラムおよび情報処理システムを提供することができる According to the present invention, it is possible to flexibly cope with the difference in linguistic phoneme decomposition between the original character string and the other language of the conversion destination, and further directly convert the phoneme of the original character string and the phoneme of the conversion destination character string. To provide an information processing apparatus, a character string conversion method, a program, and an information processing system that can improve conversion accuracy, flexibly cope with language diversity, and do not waste hardware resources. it can
以下、本発明を、実施形態をもって説明するが、本発明は、後述する実施形態に限定されるものではない。図1は、本実施形態の情報処理装置100の機能ブロック図である。情報処理装置100は、パーソナル・コンピュータ、ワークステーション、またはサーバ専用機として実装することができる。
Hereinafter, although this invention is demonstrated with embodiment, this invention is not limited to embodiment mentioned later. FIG. 1 is a functional block diagram of the
情報処理装置100をサーバ専用機として実装する場合、マイクロプロセッサとしては、PENTIUM(登録商標)、PENTIUM(登録商標)互換チップ、などのCISCアーキテクチャのマイクロプロセッサ、または、POWER PC(登録商標)などのRISCアーキテクチャのマイクロプロセッサを使用することができ、シングルコアでもマルチコアでもかまわない。また、情報処理装置100をサーバ専用機として実装する場合、そのオペレーティングシステム(OS)は、WINDOWS(登録商標)200X、UNIX(登録商標)、LINUX(登録商標)などを使用することができる。
When the
また、情報処理装置100は、サーバ専用機として実装される場合、C++、JAVA(登録商標)、JAVA(登録商標)BEANS、PERL、RUBYなどのプログラミング言語を使用して実装される、CGI、サーブレット、APACHE、IISなどのサーバ・プログラムを実行し、ネットワーク(図示せず)を介して各種要求を処理する。なお、情報処理装置100が、サーバ専用機として実装される場合、情報処理装置100は、ウェブ・サーバとすることができる。また情報処理装置100は、CORBA(Common Object Resource Broker Architecture)を使用した分散コンピューティングを可能とする専用サーバとすることができる。
Further, when the
情報処理装置100をパーソナル・コンピュータまたはワークステーションなどを使用して実装する場合、マイクロプロセッサ(MPU)は、これまで知られたいかなるシングルコア・プロセッサまたはデュアルコア・プロセッサを含んでいてもよい。この実施形態では、情報処理装置100は、WINDOWS(登録商標)、UNIX(登録商標)、LINUX(登録商標)、MAC OS(登録商標)など、いかなるオペレーティング・システムを搭載してもよい。また、情報処理装置100は、ウェブ・クライアントとして機能する場合、Internet
Explorer(登録商標)、Mozilla、Opera、Netscape(登録商標) Navigatorなどのブラウザ・ソフトウェアを使用して、HTTPプロトコルを使用してウェブ・サーバにアクセスすることが可能とされている。
When the
Browser software such as Explorer (registered trademark), Mozilla, Opera, and Netscape (registered trademark) Navigator can be used to access a web server using the HTTP protocol.
図1の情報処理装置100の機能ブロックについて以下、詳細に説明する。本実施形態の情報処理装置100は、元言語として、カタカナ、平仮名、ハングルなどを含む表音文字列を使用する。また、他の言語としてはアルファベット、イスラム語、ヘブライ語、スラブ語、ヒンズー語など、インド・西ヨーロッパ語圏の言語を使用することができる。以下、本実施形態を具体的に説明する目的で、元言語を、平仮名またはカタカナを含むカナとし、他の言語を、アルファベットとして説明する。また、以下に説明する各機能部は、メモリなどにプログラムを展開し、CPUまたはマイクロプロセッサがプログラムを実行することによって情報処理装置100の機能手段として実現される。
The functional blocks of the
情報処理装置100は、情報処理装置本体110と入力部112と、入出力インタフェース114とを含んでいる。入力部112は、図1に示した実施形態では、キーボードなどを使用することができる。また入力部112は、元文字列としてカナ文字列を入力し、入出力インタフェース114を介して、元文字取得部であるカナ文字取得部116にカナ文字(列)を送付する。なお、図1に示した情報処理装置100は、この他、ディスプレイ装置を含んでいるが、本実施形態の要旨には関係しないので説明を省略する。
The
カナ文字取得部116は、受領したカナ文字列を音素分解部120に送付する。音素分解部120は、音素データ格納部126を参照して、受領したカナ文字列を変換処理単位として使用する音素シーケンスに分解する。例えば、カナ文字列が、「インフォメーション」の場合、元文字音素として、「イ」、「ン」、「フォ」、「メー」、「ショ」、「ン」の各音素に分解する。なお、本実施形態における元文字音素への分解は、カナとして独立できる単位を最小単位とし、長音、促音などがある場合、長音、促音を直前のカナ文字に結合して音素として登録する。
The kana
なお、音素データは、カナ文字列およびアルファベット文字列について、言語学上の最小単位となるべき音素を、例えば特定のカナ音素について、当該カナ音素に対応する音素として分類するべきアルファベット音素を対応付けて登録するデータ構造として作成することができ、予め音素データ格納部126に登録しておくことができる。
Note that phoneme data associates phonemes that should be the smallest linguistic unit for kana character strings and alphabetic character strings, for example, for alphabetic phonemes that should be classified as phonemes corresponding to the kana phonemes for specific kana phonemes. Can be created as a data structure to be registered, and can be registered in the phoneme
また、例えばハングルなど他の言語を元文字とする場合には、言語学上の観点から適切な単位で元文字音素を登録することができる。なお、元言語がカナではなく、他の言語もアルファベットでない場合には、元言語の音素および他言語の音素をそれぞれ対応付けて音素データ格納部126に登録すればよい。なお、元文字音素および変換先音素は、後述する学習の際の経路探索での、セルを定義する単位として使用される。
Further, when another language such as Korean is used as the original character, the original character phoneme can be registered in an appropriate unit from the viewpoint of linguistics. If the original language is not kana and the other languages are not alphabets, the original language phonemes and the other language phonemes may be associated with each other and registered in the phoneme
音素分解部120は、カナ文字列の音素分解が終了すると、音素分解結果を、変換尤度計算部122に送付する。変換尤度計算部122は、確率モデル格納部128をルックアップして、変換尤度を計算する。確率モデル格納部128は、確率モデルを格納しており、確率モデルは、特定のカナ文字に対応し文字変換を行う言語の音素である変換先音素の変換確率を登録する。変換確率とは、例えばカナ音素「イ」に対して、アルファベット音素「I」と対応付けるための確率である。
When the phoneme decomposition of the kana character string is completed, the
また、確率モデルは、連続する音素間の遷移確率を登録する。遷移確率とは、例えばアルファベット「I」の後続音素として「N」が出現する確率である。説明する特定の実施形態では、アルファベット音素に対してアルファベットの音素を対応付ける確率πおよびカナ文字に対応する連続する音素シーケンスが連続する遷移確率Pを例えば遷移確率テーブルとして登録している。 The probability model registers the transition probability between consecutive phonemes. The transition probability is a probability that “N” appears as a subsequent phoneme of the alphabet “I”, for example. In the specific embodiment to be described, the probability π of associating alphabetic phonemes with alphabetic phonemes and the transition probability P of continuous phoneme sequences corresponding to kana characters are registered as, for example, a transition probability table.
変換尤度計算部122は、確率モデル格納部128を参照して、取得したカナ文字の音素シーケンスをフォワード処理し、先頭のカナ文字の変換確率π1を取得し、続いた直後のカナ文字の変換確率π2および先頭カナ文字−後続カナ文字間の遷移確率P12を取得する。上記の処理を音素シーケンスが終了するまで実行し、生成された確率値を使用して積算、乗算、または他の適切な計算式を使用してカナ音素シーケンス−アルファベット音素シーケンスについて、先頭から最後尾までの変換尤度χを計算する。
The conversion
最尤音素シーケンス決定部118は、変換尤度計算部122の確率計算が終了した通知を受けて、変換尤度計算部122が作成した結果リストを検索し、説明する実施形態では、変換尤度χの最も大きなアルファベット・シーケンスを、最尤のアルファベット文字列候補として決定し、結果出力部130に文字列変換結果として出力する。出力結果は、好ましい実施形態では、ディスプレイ装置のデスクトップ画面に表示され、ユーザが適宜ハードコピーすることができる。
The maximum likelihood phoneme
なお、音素データ格納部126に格納される音素データおよび確率モデル格納部128に格納される遷移確率は、文字変換処理を実行する前にプリプロセッサ124が作成し、ハードディスク装置(図示せず)や、EEPROM、EPROMなどに登録しておくことができる。なお、他の実施形態では、音素データおよび遷移確率データ、を実行データとしてプログラム実行時にハードディスク装置などから、情報処理装置100のRAMへと読出して使用することができる限り、情報処理装置100にプリプロセッサ124を実装しなくともよい。
Note that the phoneme data stored in the phoneme
図2は、情報処理装置100が含むプリプロセッサ124の機能ブロック構成200を示す。プリプロセッサ124には、システム管理者や開発者によって、アライメント済み事例および未アライメント事例が入力される。アライメント済み事例とは、カナ音素とアルファベット音素とが、すでに対応付けられたデータ・セットとして定義される。また、未アライメント事例とは、互いに対応付けを行うべきアルファベット文字列と、カナ文字列とからなるデータ・セットとして定義され、後述するコスト・モデルを使用して確率モデルの精度を向上させるための学習データとして使用される。
FIG. 2 shows a
プリプロセッサ124は、アライメント済み事例210を受領すると、コスト・モデル生成部214に渡す。コスト・モデル生成部214は、アライメント済み事例210のデータのカナ音素−アルファベット音素の対応付け関係を使用してカナ音素−アルファベット音素の対応付けのコストを計算する。そして、コスト・モデル生成部214は、取得したアライメント済み事例210の要素集合全体について、コスト計算を実行し、それぞれのアライメント済み事例から、カナ音素とアルファベット音素との対応付けするためのコスト・モデルを生成し、適切な記憶領域に格納する。
Upon receiving the aligned
また、アライメント処理部216は、生成されたコスト・モデルを使用して、未アライメント事例212のアライメントを実行し、コスト・モデルにより与えられる音素間のコストを計算する。さらにアライメント処理部216は、カナ音素に対して対応付け可能な複数のアルファベット音素を対応付けて複数の異なる経路マップを生成し、各経路マップに対してコスト・モデルを適用し、最低コストのアライメントを決定することで、アライメントによる学習事例を生成し、その結果をアライメント結果格納部220に格納する。
In addition, the
確率モデル生成部218は、アライメント処理部216の処理が終了すると、アライメント結果格納部220の結果を抽出し、アライメント事例の出現数をカウントして、カナ音素−アルファベット音素について、カナ音素に対応するアルファベット音素の変換確率πおよび各音素のシーケンス間の遷移確率Pを生成する。生成された各確率値は、説明する実施形態では、アルファベットに対してのカナの変換確率πおよび後続するアルファベットへの遷移確率Pを、遷移確率テーブルの型式で確率モデル格納部128に登録する。
When the processing of the
図3は、本実施形態の確率モデル生成処理の実施形態のフローチャートである。図3に示した処理は、図2に示したプリプロセッサ124が実行する処理に対応する。図3の処理は、ステップS300から開始し、ステップS301で、アライメント事例集合を取得する。ステップS302で、アライメント済み事例から最初のアライメント済み事例を取得し、アライメント・コストを計算する。アライメント・コストの計算は、アルファベットでの音素とカナの音素の間の対応関係を考慮して割当てた経路コストを使用して計算する。
FIG. 3 is a flowchart of an embodiment of the probability model generation process of the present embodiment. The process shown in FIG. 3 corresponds to the process executed by the
アライメント・コストの計算は、アライメント済み事例について対応付けされたカナ音素−アルファベット音素について、経路マップを生成させ、経路マップ上に、カナ音素−アルファベット音素のセルを割当てる。さらに、セルに沿った単位経路を一定規則の下で割当てて、先頭から末尾まで単位系路に沿って経路付けを行って、当該経路上に出現する一定規則のコストを総和することによって実行することができる。なお、アライメント・コストの計算処理についてはより詳細に後述する。 In the calculation of the alignment cost, a route map is generated for the kana phoneme-alphabet phoneme associated with the aligned case, and a kana phoneme-alphabet phoneme cell is allocated on the route map. Furthermore, the unit route along the cell is assigned under a certain rule, routed along the unit system route from the beginning to the end, and executed by summing the costs of the certain rule appearing on the route. be able to. The alignment cost calculation process will be described later in more detail.
ステップS303では、アライメント済み事例集合の全要素についてコストを決定したか否かを判断し、全要素についてコストを決定していない場合(no)、処理をステップS302に分岐させ、アライメント済み事例集合全部の処理が終了するまでコスト計算を蓄積する。なお、アライメント済み事例は、プログラム作成者側で、プログラムのデータ作成作業により、作成することができる。 In step S303, it is determined whether or not the cost has been determined for all elements of the aligned case set. If the cost has not been determined for all elements (no), the process branches to step S302, and the entire aligned case set is determined. The cost calculation is accumulated until the process is completed. The aligned case can be created by the program creator on the program creator side.
ステップS303で、全要素についてコスト計算が終了したと判断した場合(yes)、ステップS304で、カナ音素−アルファベット音素対応付けについてのコスト・モデルを、コスト計算の結果を参照して生成する。コスト・モデルは、連続する音素間の対応付けのアルファベット変換における音素の増減を含めた妥当性の尺度を提供する。 If it is determined in step S303 that cost calculation has been completed for all elements (yes), a cost model for kana-phoneme-alphabet phoneme association is generated with reference to the result of cost calculation in step S304. The cost model provides a measure of validity including the phoneme increase and decrease in the alphabet conversion of the correspondence between successive phonemes.
ステップS305では、プリプロセッサ124が未アライメント事例集合を取得する。ステップS306で、コスト・モデルを使用して情報処理装置100がアライメント処理を実行して、情報処理装置100による自動アライメント済み集合を生成し、適切な記憶領域に格納する。自動アライメント処理は、より具体的には、コスト・モデルを生成する際にアライメント済み事例から抽出されたアルファベット音素を、コスト・モデルを参照しながら未アライメント事例のカナ音素に対して割当てて複数の経路マップを生成し、各経路マップについて先頭音素から末尾音素までの経路コストを計算する。全経路マップについて経路コストを計算した後、特定の未アライメント事例について最小のコストを与えるアルファベット音素をそれぞれ割当てることによって実行される。
In step S305, the
ステップS307では、未アライメント事例集合内の全集合要素についてアライメントを完了したか否かを判断し、全集合要素について処理が終了していない場合(no)、処理をステップS306に分岐させて、自動アライメント処理を反復させる。一方、全集合要素についてアライメント完了した場合(yes)、ステップS308でカナ音素−アルファベット音素の変換確率および音素間の遷移確率を計算し、確率モデルを生成する。確率モデルの型式は種々想定することができるが、コスト・モデルにそれぞれ登録されたカナ音素およびアルファベット音素についてその変換確率と、先行音素および後続音素の間の遷移確率とを登録して生成することができる。ステップS309では、生成した確率モデルを確率モデル格納部128に登録し、ステップS310で、確率モデル生成処理を終了する。
In step S307, it is determined whether or not alignment has been completed for all set elements in the unaligned case set. If processing has not been completed for all set elements (no), the process branches to step S306 to automatically Repeat the alignment process. On the other hand, if the alignment has been completed for all the set elements (yes), the conversion probability of kana phoneme-alphabet phoneme and the transition probability between phonemes are calculated in step S308, and a probability model is generated. Various types of probabilistic models can be assumed, but the conversion probabilities and transition probabilities between preceding and succeeding phonemes are registered and generated for kana and alphabetic phonemes registered in the cost model. Can do. In step S309, the generated probability model is registered in the probability
以上の処理は、プリプロセッサ124が実行する処理であり、プリプロセッサ124を実装しない実施形態では、確率モデルは、文字変換処理を実行するためのプログラムの実行データとして、CD−ROM、DVD−ROMなどから、インストール時にハードディスク装置の適切な記憶領域に格納することができる。そして、プログラムの実行開始とともに、ハードディスク装置からRAMなどの高速アクセス・メモリに読出され、プログラムの実行に利用される。また、情報処理装置100がプリプロセッサ124を含む場合には、確率モデルを直接ハードディスク装置に登録し、プログラム実行時に、RAMなどの高速アクセス・メモリに読出してプログラムの実行に利用する。いずれの実施形態であっても、音素データおよび確率モデルは、プログラムが実行のために呼び出される段階で、情報処理装置100のRAMなどに格納されて、プログラムにより利用される。
The above processing is processing executed by the
図4は、図3のステップS301でプリプロセッサ124が取得するアライメント済み事例集合400を、その要素のデータ構造とともに示す。アライメント済み事例集合は、プログラムの開発者サイドで、プログラム実行の実行データを作成するための基礎的データとして収集・選択され、音素単位で、カナ−アルファベットを対応付けすることにより生成される。図4に示した実施形態では、例えば、information、george、smith、clintonなどのアルファベット文字列に対して音素単位でカタカナが対応付けられている。図4に示した実施形態では、対応付けを、括弧(「」)で示しているが、スペース、カンマ、コロン、セミコロン、/など、プリプロセッサ124が識別でき、カナ・アルファベット以外のコードであれば、いかなる区切り方式を使用してもよい。
FIG. 4 shows the aligned case set 400 acquired by the
図4に示したアライメント済み事例集合は、その要素数が多ければ多いほど、生成するコスト・モデルの精度が向上し、より高精度の文字列変換を可能とする。また、文字列変換の際に特徴的なコスト値ができるだけ出現する文字列、例えば「ex」、「ox」、「ign」、「kno」など、変換後の音素数が変わるもの、アルファベットの単語を発音しない、いわゆる黙字などを含むアルファベット文字列とカナ文字列とを、アライメント済み事例集合として選択することが好ましい。 As the number of elements in the aligned case set shown in FIG. 4 is larger, the accuracy of the cost model to be generated is improved, and more accurate character string conversion is possible. In addition, a character string in which a characteristic cost value appears as much as possible during character string conversion, for example, “ex”, “ox”, “ign”, “kno”, etc., whose phoneme number after conversion changes, alphabetic words It is preferable to select an alphabet character string including a so-called silent character and a kana character string that do not pronounce the character as an aligned case set.
図5は、図3の処理のステップS302で実行する、アライメント済み事例に関してアライメント・コストを計算する処理の概念図である。アライメント・コストは、カナ音素に対して対応付けられたアルファベット音素から、経路マップ500を生成して実行される。アライメント済み事例を使用するアライメント・コストの計算は、カナ音素に対してアルファベット音素を対応付ける場合、特に文字列変換において音素数が対応付けられない場合であっても、当該対応付けを最適に割当てるために適切なコスト・セットを生成するための処理である。
FIG. 5 is a conceptual diagram of the process for calculating the alignment cost for the aligned case executed in step S302 of the process of FIG. The alignment cost is executed by generating a
カナとアルファベット間で音素が一対一に対応付けできない場合とは、具体的に説明すると、例えば、「IN」は、カナ音素で「イ」+「ン」と変換されるので音素数の対応付けには過不足はない。ところが、アルファベット文字列「OX」は、カタカナでは、「オッ」+「ク」+「ス」と発音され、アルファベット文字数よりもカタカナ文字数が増加することになり、対応付ける場合には音素数の変化を考慮することが必要となることに対応する。一方、「FOR」は、アルファベット音素で、「F」+「O」+「R」となるが、カナ音素では、1音素「フォ」となるので、アルファベット音素の方が音素数が増えることになることに対応するものである。 More specifically, the case where phonemes cannot be correlated one-to-one between kana and alphabets. For example, “IN” is converted to “i” + “n” in kana phonemes, so the number of phonemes is correlated. There is no excess or deficiency. However, the alphabet string “OX” is pronounced as “O” + “K” + “Su” in Katakana, and the number of Katakana characters increases compared to the number of alphabet characters. Corresponds to what needs to be considered. On the other hand, “FOR” is an alphabetic phoneme, and is “F” + “O” + “R”. However, in Kana phoneme, one phoneme is “fo”, so that the number of phonemes in alphabetic phoneme increases. It corresponds to becoming.
上述した対応付けを行うために、本実施形態では、経路マップ500に対してそれぞれの文字列の先頭から末尾まで、各文字列の単位音素で規定されるセル510を定義し、セルに沿って単位経路を定義する。単位経路は、本実施形態では、斜め経路520、垂直経路530、水平経路540の各経路として示されており、経路の進行態様に対してコストを割当て、最小コスト経路を与える経路探索問題としてコスト・モデルを処理する。
In order to perform the above-described association, in the present embodiment, a
説明する実施形態では、経路探索の進行態様を、本実施形態では、以下の3規則に限定する。
(1)カナ音素とアルファベット音素が対応付けられる場合には、セルを斜めに横断する斜め経路520を進行する。
(2)カナ音素が、アルファベット音素よりも短い場合、セルの垂直経路530を進行する。
(3)カナ音素が、アルファベット音素よりも長くなる場合、セルの水平経路540を進行する。
In the embodiment to be described, the progress mode of the route search is limited to the following three rules in the present embodiment.
(1) When a kana phoneme and an alphabetic phoneme are associated with each other, an
(2) If the kana phoneme is shorter than the alphabet phoneme, it proceeds along the
(3) If the kana phoneme is longer than the alphabet phoneme, proceed along the
斜め経路の場合は、対応付けに問題はないので、最小コストCminを与える。また、垂直経路を進行する対応付けの場合は、インド・ヨーロッパ語では、発音されない黙字が存在する場合や音節の関係でカナ音素の促音や長音とされる場合などが対応し、一致性は低下するが、重大な不一致ではないので、完全一致よりも高いコストCmedを割当てる。この逆に、アルファベットでもカナでも、同一の音素が同一の単語に出現することは頻繁にあるので、不適切に離れた音素の対応付けを排除するために、水平経路は、他の経路に比べてコストを高める必要が好ましい。一方では、上述したように、アルファベット文字列「OX」のように自然言語上、合理的な範囲でカナ文字が増えてしまう場合があり、水平経路を含む対応付けを完全に排除することは不適切である。このため、水平経路には、他の2つよりも高い、Cmaxのコストを割当てる。上述した経路探索規則に基づき、アライメント済み事例についてコストを下記式(1)を使用して計算する。 In the case of an oblique route, since there is no problem in association, a minimum cost C min is given. In addition, in the case of mapping that travels along the vertical path, in Indo-European languages, there are cases where silent letters that are not pronounced are present, or when kana phoneme prompts or long sounds are considered due to syllables, etc. Decrease but not a serious mismatch, so assign a higher cost C med than an exact match. On the contrary, the same phoneme frequently appears in the same word in both alphabets and kana, so the horizontal path is compared to other paths in order to eliminate the mapping of inappropriately separated phonemes. It is preferable to increase the cost. On the other hand, as described above, the kana characters may increase within a reasonable range in the natural language like the alphabet character string “OX”, and it is impossible to completely eliminate the correspondence including the horizontal path. Is appropriate. For this reason, the horizontal path is assigned a higher cost of C max than the other two. Based on the route search rule described above, the cost is calculated using the following formula (1) for the aligned cases.
上記式(1)中、CTOTALは、合計スコアであり、サフィックスa、b、cは、それぞれセル単位での斜め経路の発生数、垂直経路の発生数、水平経路の発生数である。
In the above formula (1), C TOTAL is the total score, and suffixes a, b, and c are the number of oblique paths, the number of vertical paths, and the number of horizontal paths in cell units, respectively.
アライメント済み事例集合の要素については、経路は一義的に定められるので、各アライメント事例について合計コストを解析し、完全整合の経路の合計コストを音素数で除算した値が最も高くなり、垂直経路を含む経路の合計コストを音素数で除算した値が中間的な値を与え、水平経路を含む場合の合計コストを音素数で除算した値が、他の2態様の場合よりも高い最高値を与えるように、各コスト値Cmin、Cmed、Cmaxを設定する。 For the elements of the aligned case set, the path is uniquely defined, so the total cost is analyzed for each alignment case, and the total cost of the perfectly matched path divided by the number of phonemes is the highest, and the vertical path is A value obtained by dividing the total cost of the path including the phoneme number gives an intermediate value, and a value obtained by dividing the total cost including the horizontal path by the phoneme number gives a higher maximum value than in the other two modes. In this way, the cost values C min , C med , and C max are set.
上述した実施形態では、縦・横・斜にそれぞれ固定のコストを割当てるものとして説明した。他の実施形態では、アルファベット毎に異なる(横)コスト、カタカナ毎に異なる縦コスト、アルファベットとカナのペア毎に異なる(斜)コストを割当てることもできる。当該実施形態の場合、経路上の辺x(縦でも横でも斜でも)のコストをCxとして、上記式(1)に代えて、下記式(1′)で与えられる合計スコアを使用することができる In the above-described embodiment, it has been described that fixed costs are assigned to the vertical, horizontal, and diagonal directions. In another embodiment, a different (horizontal) cost for each alphabet, a different vertical cost for each katakana, and a different (slanted) cost for each alphabet / kana pair may be assigned. In the case of this embodiment, it is possible to use the total score given by the following formula (1 ′) instead of the above formula (1), where Cx is the cost of the side x (vertical, horizontal, or diagonal) on the route. it can
図5を使用して経路コスト計算を説明すると、図5に示した実施形態では、カナ文字列=インフォメーションであり、アルファベット文字列=INFORMATIONである。アライメント済み事例では、イ=I、ン=N、フォ=FOR、メー=MA、ショ=TIO、ン=Nとして予めアライメントされているので、「FOR」、「MA」、「TIO」について一義的に、垂直経路530が割当てられ、その他の経路は、斜め経路520が割当てられている。
The route cost calculation will be described with reference to FIG. 5. In the embodiment shown in FIG. 5, the kana character string = information and the alphabet character string = INFORMATION. In the aligned case, since it is pre-aligned as i = I, n = N, fo = FOR, mae = MA, sho = TIO, n = N, “FOR”, “MA”, “TIO” are unambiguous. The
一方、図3のステップS305およびステップS306では、未アライメントの事例集合を使用して、経路探索を実行し、合計コストの最小値を与えるアライメントを、最適対応付けとし、変換確率および遷移確率を計算させるために、学習させる。未アライメント事例は、対応付けるべき、{アルファベット文字列、カナ文字列のデータ・セットとして定義される。例えば、図5を使用して未アライメント事例が、「インフォメーション」である場合を説明する。 On the other hand, in step S305 and step S306 in FIG. 3, the path search is performed using the unaligned case set, and the alignment that gives the minimum value of the total cost is set as the optimum association, and the conversion probability and the transition probability are calculated. To learn. An unaligned case is defined as a data set of {alphabet character string, kana character string} to be associated. For example, a case where the unaligned example is “information” will be described with reference to FIG.
カナ文字列=インフォメーションについて、音素データを参照することにより、「イ」、「ン」、「フォ」、「メー」、「ショ」、「ン」のカナ音素シーケンスが与えられる。一方アルファベット文字列についても、音素データ格納部126をルックアップして、アライメント済み事例を処理した段階で登録され、同一のカナ音素に対応付けられたアルファベット音素を列挙して音素シーケンスを生成し、複数の経路マップを作成する。
By referring to the phoneme data for the kana character string = information, a kana phoneme sequence of “i”, “n”, “fo”, “mae”, “sho”, “n” is given. On the other hand, for the alphabet string, the phoneme
そして与えられた複数の経路マップに対し、図5で説明した規則を使用して経路コストを計算する。例えば、ステップS306の経路探索によるアライメントの途上では、経路550の他、経路560、経路570が探索される。このとき、計算されるCTOTALは、経路550が最小となるので、アライメント事例と同様に、経路550が最適経路として採用され、経路560、570は、廃棄される。
Then, for the given plurality of route maps, the route cost is calculated using the rules described in FIG. For example, in the course of alignment by the route search in step S306, the
なお、上述した図5を使用したアライメントのための経路探索は、図5で説明した実施形態の他に、例えば、適切な条件を設定したビタビ・アルゴリズムを適用して実行することができる。 The above-described path search for alignment using FIG. 5 can be executed by applying, for example, a Viterbi algorithm in which appropriate conditions are set, in addition to the embodiment described in FIG.
さらに、本実施形態の確率モデル生成処理を説明する。図3のステップS308では、カナ音素−アルファベット音素の対応付け例からカナ音素に対応するアルファベット音素の割当て確率πおよび連続する音素間の遷移確率Pを学習事例を統計解析して生成する。図6は、未アライメント事例集合を使用したアライメント学習の実施形態を説明する概念図である。アライメント済み事例を解析することにより、情報処理装置100は、コスト・モデル650を生成し、適切な記憶領域に格納している。コスト・モデル650は、カナ音素=アについて、アルファベットの先行文字=a、e、o、r、uの場合が有るとして割当て、後続文字が、e、h、rの場合、コストがそれぞれ1、2(それぞれ例えば、aero、our(アワ)に対応する。また、カナ音素=イについても同様にコストが登録される。
Furthermore, the probability model generation process of this embodiment will be described. In step S308 of FIG. 3, an alphabetic phoneme allocation probability π corresponding to a kana phoneme and a transition probability P between consecutive phonemes are generated by statistically analyzing learning examples from the kana phoneme-alphabet phoneme correspondence example. FIG. 6 is a conceptual diagram illustrating an embodiment of alignment learning using an unaligned case set. By analyzing the aligned case, the
なお、コスト=1は、例示する目的で斜め経路のコストであり、コスト=2は、垂直経路のコストであり、コスト=3は、水平経路のコストである。コスト・モデル650を、未アライメント事例に対するアライメント結果に適用して合計コストを計算し、可能な経路のうち、上述したように、合計コストを最小とする経路をカナ音素−アルファベット音素の対応付けとして学習させる。そして、図6に示すように、学習結果として蓄積されたアライメント結果を使用して確率モデル700を、遷移確率テーブルとして生成する。
Note that cost = 1 is the cost of an oblique path for the purpose of illustration, cost = 2 is the cost of a vertical path, and cost = 3 is the cost of a horizontal path. The
図7は、図6のアライメント学習によって生成された確率モデル700の実施形態のデータ構造を示す。図7に示す確率モデル700は、アルファベット音素と、当該アルファベット音素に対するカナ音素およびその対応付けの確率π、後続アルファベット音素およびその変換確率Pとが対応付けられている。なお、後続アルファベット音素に対応付けられるカナ音素は、図7に示した実施形態では省略して示す。
FIG. 7 shows the data structure of an embodiment of a
図7に示すように、先行アルファベット音素が「a」である場合、カナ音素は、「ア」、「エ」、「エー」、「ヤ」、「アッ」などが登録され、それぞれカナ音素に対応付けされる変換確率πが対応付けて登録されている。また、その右手側の各フィールドには、後続アルファベット音素が、「n」、「l」、「c」、「s」、「li」などとして登録され、先行アルファベット音素「a」の後に各アルファベット音素が出現する遷移確率Pが登録されている。 As shown in FIG. 7, when the leading alphabet phoneme is “a”, kana phonemes are registered as “a”, “e”, “a”, “ya”, “a”, etc. Corresponding conversion probabilities π are registered in association with each other. In each field on the right-hand side, subsequent alphabetic phonemes are registered as “n”, “l”, “c”, “s”, “li”, etc., and each alphabet after the preceding alphabetic phoneme “a” is registered. A transition probability P at which a phoneme appears is registered.
以上で、図1および図2に示したプリプロセッサ124が実行する音素データ生成および遷移確率生成処理が完了する。情報処理装置100は、上述した処理で生成された確率モデル700を使用して、カナ文字列−アルファベット文字列の文字列変換処理を実行する。以下、情報処理装置が実行する文字列変換処理を、図1および図8を参照して説明する。
Thus, the phoneme data generation and transition probability generation processing executed by the
図7に示した確率モデルに基づき、アルファベット音素への対応付けを隠れマルコフ・モデルでの状態遷移として記述したのが状態遷移図800である。状態遷移図800に示すように、隠れマルコフ・モデルでは、観測系列となるカナ音素=「イ」について、状態遷移系列であるアルファベット音素=「I」に対応付ける確率は、確率モデル700をルックアップすることによりπ1として決定される。先頭の音素について対応付けを終了した後、カナ音素=「ン」の処理を実行し、「イ」に後続する「N」について確率モデル700をルックアップして、P12およびπ2の値を取得し、以後順次、π3、P23、...を確率テーブル700をルックアップして取得して行く。
Based on the probability model shown in FIG. 7, the state transition diagram 800 describes the association with alphabetic phonemes as the state transition in the hidden Markov model. As shown in the state transition diagram 800, in the hidden Markov model, the probability that the kana phoneme = “I” as the observation sequence corresponds to the alphabetic phoneme = “I” as the state transition sequence looks up the
なお、図8中、Pijは、それぞれ状態Siの時にSjの遷移を生じさせる確率であり、πiは、状態Siのとき、変換先音素xに変換される確率であり、下記式(2)により定式化することができる。 In FIG. 8, P ij is a probability of causing a transition of S j in each state S i , and π i is a probability of being converted to a conversion destination phoneme x in the state S i , and Formula (2) can be formulated.
その後、変換尤度計算部122は、取得された各確率値を使用して、カナ文字列の先頭から末尾までの変換尤度χを、各確率の対数を取り、下記式(2)を使用して計算する。
Thereafter, the conversion
さらに、図1に示した最尤音素シーケンス決定部118は、変換尤度計算部122の計算した変換尤度χを取得し、変換尤度χのマックスを与える状態遷移系列としてアルファベット音素のシーケンスを取得する。そして、取得したアルファベット音素のシーケンスを、最尤音素シーケンスとしてアルファベット出力部130に渡し、一連の文字列変換処理を終了する。
Further, the maximum likelihood phoneme
図9は、本実施形態の情報処理装置100をウェブ・サーバ910として実装し、さらに複数のインド・西ヨーロッパ語圏の言語に対応することが可能な、情報処理システム900の実施形態を示す。なお、図9の情報処理システム900は、プリプロセッサ124に相当する機能を含まず、文字列変換を実行するためのプログラムとともに実行データとしてハードディスク装置990に格納されているものとして説明する。
FIG. 9 shows an embodiment of an
なお、サーバ910は、プリプロセッサ124に相当する機能を含んで構成することもでき、この場合、ネットワークを介して特定のユーザに適したアライメント済み事例集合や未アライメント事例集合を受領して、ユーザごとに、例えば専門分野別にカスタマイズした文字列変換サービスを提供するように構成することもできる。
The
以下、図9を使用して情報処理システム900を説明する。情報処理システム900は、ウェブ・サービスを提供する。ウェブ・サーバ910は、ネットワーク・アダプタ930と、各種要求をサーバ・プログラムの型式に適合させるためのCGI(Common Gateway Interface)940と、カナ文字取得部950とを含んで構成されている。ネットワーク・アダプタ930は、ネットワーク・インタフェース・カード(NIC)を含み、インターネットなどのネットワーク920を介して要求を受領し、またウェブ・サーバ910の処理結果を、ネットワーク920を介して遠隔接続されたウェブ・クライアント(図示せず)に返している。
Hereinafter, the
ウェブ・サーバ910は、さらに各種データベース990を管理している。データベース990は、カナ文字列で表現されたインド・西ヨーロッパ語の言語種類を推定するために使用する言語種類推定形態素辞書990aと、言語種別確率モデル格納部990bとを含んで構成される。
The
カナ文字取得部950は、ウェブ・クライアントからの文字列変換要求に含まれるカナ文字列を、CGI940を介して取得する。カナ文字取得部950は、言語種別推定形態素辞書990aをルックアップして、カナ文字列に対応する特有の形態を検索し、言語種類を推定する。なお、他の実施形態では、ユーザが言語種類を特定するデータを文字列変換要求に含ませておくことができ、この場合、カナ文字取得部950は、当該データを音素分解部960などに送付して文字列変換を実行する。
The kana
カナ文字取得部950は、カナ文字列および言語種類のデータを取得すると、カナ文字列を音素分解部960に渡す。音素分解部960は、受領したカナ文字列を音素データ格納部をルックアップして音素分解し、音素分解の結果を変換尤度計算部970に渡す。変換尤度計算部970は、推定された言語種類に対応して登録された確率モデルを、言語種別確率モデル格納部990bから呼出して、遷移確率の計算を実行する。
When the kana
最尤文字種シーケンス決定部980は、図1に示した最尤アルファベット・シーケンス決定部118と同様の機能を含んで実装されており、変換尤度計算部970が計算した変換尤度χの最大値を与える音素シーケンスを、最尤文字種シーケンスとして決定する。その後、最尤文字種シーケンス決定部980は、その結果を、ネットワーク・アダプタ930を介してウェブ・クライアントへと返し、ウェブ・クライアントが要求したカナ文字列に対応する文字種・シーケンスを返す。
Maximum likelihood character type
また、他の実施形態で、最尤文字種シーケンス決定部980は、カナ文字列が人名である場合、生成した文字列シーケンスを、GNA(Grobal Name Analytics)サーバ995に送付して、人名検索を実行することもできる。なお、GNAについては、例えば、https://publibfp.boulder.ibm.com/epubs/pdf/c1912860.pdfで記述されるシステムまたはサーバを挙げることができる。
In another embodiment, the maximum likelihood character type
図9に示した情報処理システム900は、ユーザから送付されたカナ文字列を、その言語種別を識別して対応するインド・西ヨーロッパ語に変換することが可能となり、高い言語汎用性を提供することが可能となる。また、プリプロセッサを実装する実装形態の場合、ユーザに対してカスタマイズした文字列変換を可能とでき、ユーザごとに異なるウェブ・サーバや確率モデルを作成することなく、効率的なウェブ・サービスを提供することができる。
The
さらに変換されたインド・西ヨーロッパ語のシーケンスが人名である場合、人名検索システム995への入力インタフェースとして機能することができるので、個人検索、名寄せ、マネーロンダリングなどの重要な用途に対して効率的に検索結果を返すことが可能となる。
Furthermore, if the converted Indo-West European sequence is a person name, it can function as an input interface to the person
図10は、本実施形態のウェブ・サーバ910が実行する文字変換処理の実施形態のフローチャートである。図10に示す処理は、カナ−アルファベット文字列変換要求およびアライメント要求(ブロックB)を並列的に記述するが、各要求はそれぞれ単独で処理することができる。
FIG. 10 is a flowchart of an embodiment of character conversion processing executed by the
図10の処理は、ステップS1000から開始し、ステップS1001で、カナ文字列またはカナ文字列およびアルファベット文字列の両方を含む要求をウェブ・サーバ1010が受領する。カナ文字列のみを受領する場合は、文字列変換要求であり、上述したように言語種類を推定するためのデータを同時に受領してもよい。また、カナ文字列とアルファベット文字列とを同時に受領する実施形態は、アライメント要求に対応し、図5に示した経路探索を実行し、合計コストが最小のアライメントペアをレスポンスとして返す実施形態である。 The process of FIG. 10 starts from step S1000. In step S1001, the web server 1010 receives a request including a kana character string or both a kana character string and an alphabetic character string. When only a kana character string is received, it is a character string conversion request, and data for estimating the language type may be received simultaneously as described above. Further, the embodiment in which the kana character string and the alphabet character string are received simultaneously is an embodiment that responds to the alignment request, executes the route search shown in FIG. 5, and returns the alignment pair with the minimum total cost as a response. .
ステップS1002は、カナ文字列またはアルファベット文字列がある場合には、アルファベット文字列についても音素分解し、ステップS1003で、カナ文字列とアルファベット文字列が両方存在する可動かを判断する。両方存在する場合(yes)、受領した要求はアライメント要求であると判断し、ブロックBに処理を分岐させる。また、カナ文字列およびアルファベット文字列の両方を含まないと判断した場合(no)、ステップS1004で、言語種類に対応する確率モデルを使用して尤度確率χを計算する。ステップS1005では、尤度確率χの尤も大きい文字列を取得し、ステップS1006で、変換結果を表示するための適切なフォーマット、例えばRSS、テーブルなどのフォーマットで変換結果を作成し、構造化文書として、出力させ、ステップS1007で処理を終了させる。 In step S1002, if there is a kana character string or an alphabet character string, the alphabet character string is also phoneme decomposed, and in step S1003, it is determined whether both the kana character string and the alphabet character string exist. If both are present (yes), it is determined that the received request is an alignment request, and the process branches to block B. If it is determined that both the kana character string and the alphabet character string are not included (no), the likelihood probability χ is calculated using a probability model corresponding to the language type in step S1004. In step S1005, a character string having a large likelihood probability χ is obtained. In step S1006, a conversion result is created in an appropriate format for displaying the conversion result, for example, a format such as RSS, table, etc. And the process is terminated in step S1007.
以上のように、本実施形態では、カナ音素と、アルファベット音素とを直接遷移確率で関連付け、隠れマルコフ・モデル(HMM)法を使用して最尤の文字列変換を実行することができるので、ハードウェア資源を効率的に使用し、さらにより直接的に高精度の検索を可能とする。また言語ごとの確率モデルを生成するだけで、言語種類に対応して柔軟な文字列変換が可能となる。 As described above, in this embodiment, the Kana phoneme and the alphabet phoneme can be directly associated with the transition probability, and the maximum likelihood string conversion can be executed using the hidden Markov model (HMM) method. It makes efficient use of hardware resources and enables more accurate search even more directly. Also, by simply generating a probability model for each language, flexible character string conversion corresponding to the language type becomes possible.
また、ブロックBの処理は、アライメント要求に対応する処理であり、ステップS1008で音素分解の結果を使用して経路探索し、合計コストの最小のアライメントを決定する。その後、ステップS1009で検索結果を表示するためのフォーマットで構造化文書を作成し、出力して、処理をステップS1007で終了させる。なお、ブロックBで説明した処理は、図5で説明した未アライメント事例の自動アライメント処理と同様の処理である。 The process of block B is a process corresponding to the alignment request. In step S1008, a route search is performed using the result of phoneme decomposition, and the minimum alignment with the total cost is determined. Thereafter, a structured document is created and output in a format for displaying the search result in step S1009, and the process ends in step S1007. The process described in block B is the same process as the automatic alignment process in the unaligned case described in FIG.
上述したブロックBの実施形態は、ウェブ・クライアントがアライメントを確認したい場合や、アライメント処理の精度をウェブ・サーバ910の管理者などが確認したい場合に使用することができ、アライメント精度の確認および校正のために利用することができる。
The embodiment of the block B described above can be used when the web client wants to check alignment, or when the administrator of the
図11〜図16を参照して、本実施形態の文字列変換処理を説明する。図11は、本実施形態の文字列変換方法で、ウェブ・クライアント925に表示されるグラフィカル・ユーザ・インタフェース(GUI)1100の実施形態である。GUI1100には、当該GUI1100がカタカナ語ローマ字変換を行うものであることが示されている。なお、ローマ字とは、ヘボン式、訓令式などで指定され、日本語をその発音に対応したアルファベットで記述するための表記方式であり、アルファベットへの変換が実質的に実行される。
A character string conversion process according to this embodiment will be described with reference to FIGS. FIG. 11 shows an embodiment of a graphical user interface (GUI) 1100 displayed on the
GUI1100には、カナを入力するフィールド1110と、検索するローマ字変換候補の上限数を指定するフィールド1120とが表示されている。ユーザは、各フィールドに文字列および上限数を入力した後、「OK」ボタンをクリックすることで、文字列変換要求をウェブ・サーバ910に送付する。ウェブ・サーバ910は、上述した文字変換処理を実行し、ウェブ・クライアント925に処理結果を返す。図11に示した実施形態では、カナ文字列=インフォメーションである。
In the
図12は、ウェブ・サーバ910による処理結果を受領したウェブ・クライアント925が表示するGUI1200の実施形態を示す。図12に示すように、ウェブ・サーバ910は、以後の参照および検索が容易となるようにRSS型式で変換結果を作成し、HTML、XMLなどの構造化文書を作成し、ウェブ・クライアント925に送付する。図12に示すように、変換対象カナ=インフォメーションであることが示され、それ以降のラインに、変換尤度χの値とともにアルファベット変換結果が表示される。図12に示されるように、最高の尤度を有するアルファベット文字列は、「information」であり、充分な精度で、文字変換が実行されているのが示される。
FIG. 12 illustrates an embodiment of a
図13は、アルファベット変換の他の実施形態を、カナ文字列=マンチェスターを使用した場合について表示するGUI1300を示す。図13では、入力されたカナ文字列=マンチェスターに対して尤度χ=0.22程度で正解の結果が与えられているのが示されている。また、第2位の尤度を有する「mancester」との間の尤度階のさも充分確保されていることが示されている。
FIG. 13 shows a
図14は、ウェブ・サーバ910が提供するさらに他の実施形態のGUI1400を示す。図14の実施形態では、本実施形態のアライメント処理の実施形態である。図14に示した実施形態は、ウェブ・サーバ910が、カナ文字列およびアルファベット文字列の両方を含むアライメント要求を受領した場合に実行する。ユーザは、GUI1400にカナ文字列およびアルファベット文字列を入力した後、「OK」ボタンをクリックすると、「インフォメーション」および「information」を含むアライメント要求が送付される。ウェブ・サーバ910は、各文字列を取得すると、音素分解を実行し、図5に示した経路探索を実行する。
FIG. 14 shows a
ウェブ・サーバ910は、経路探索の結果、合計コストが最小のカナ音素−アルファベット音素の対応付けが見出され、その対応付けを、アライメント結果としてRSS型式で記述し、構造化文書を作成する。
As a result of the route search, the
図15は、ウェブ・サーバ910がウェブ・クライアント925に送付したアライメント結果を表示するGUI1500である。図15に示すように、合計コストが最小のアライメント結果がRSS型式で表示されており、良好なアライメント精度が得られていることが示されている。さらに、図16は、同様のアライメント要求を、「マンチェスター」および「manchester」を入力した場合に生成されるアライメント結果である。図16に示されるように、カナ音素−アルファベット音素が良好に対応付けられており、カナ音素−アルファベット音素を直接対応付けする本実施形態の文字列変換処理によっても高精度のアルファベット文字列変換またはアルファベット文字列検索が可能となることが示された。
FIG. 15 is a
本実施形態の上記機能は、C++、Java(登録商標)、Java(登録商標)Beans、Java(登録商標)Applet、Java(登録商標)Script、Perl、Rubyなどのオブジェクト指向プログラミング言語などで記述された装置実行可能なプログラムにより実現でき、当該プログラムは、ハードディスク装置、CD−ROM、MO、フレキシブルディスク、EEPROM、EPROMなどの装置可読な記録媒体に格納して頒布することができ、また他装置が可能な形式でネットワークを介して伝送することができる。 The functions of this embodiment are described in an object-oriented programming language such as C ++, Java (registered trademark), Java (registered trademark) Beans, Java (registered trademark) Applet, Java (registered trademark) Script, Perl, and Ruby. The program can be realized by a program executable by the apparatus, and the program can be stored in a device-readable recording medium such as a hard disk device, CD-ROM, MO, flexible disk, EEPROM, EPROM, and distributed. It can be transmitted over the network in a possible format.
これまで本実施形態につき説明してきたが、本発明は、上述した実施形態に限定されるものではなく、他の実施形態、追加、変更、削除など、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。 Although the present embodiment has been described so far, the present invention is not limited to the above-described embodiment, and other embodiments, additions, changes, deletions, and the like can be conceived by those skilled in the art. It can be changed, and any aspect is within the scope of the present invention as long as the effects and effects of the present invention are exhibited.
100…情報処理装置、112…入力部、114…入出力インタフェース、116…カナ文字取得部、118…最尤音素シーケンス決定部、120…音素分解部、122…変換尤度計算部、124…プリプロセッサ、126…音素データ格納部、128…確率モデル格納部、200…プリプロセッサ(機能ブロック)、210…アライメント済み事例、212…未アライメント事例、コストモデル生成部、216…アライメント処理部、220…アライメント結果格納部、222確率モデル生成部、400…アライメント済み事例集合、500…経路マップ、600…未アライメント事例集合、650…コスト・モデル、700…確率モデル、800…状態遷移図、900…情報処理システム
DESCRIPTION OF
Claims (14)
前記元文字列を取得する元文字取得部と、
取得した前記元文字列を、元文字列の音素データを参照して元文字音素に分解する音素分解部と、
前記音素分解部が生成した前記元文字音素のシーケンスについて、前記元文字音素に対応し、学習により生成された確率モデルを参照し、連続する音素シーケンスについての遷移確率を使用して変換尤度を計算する変換尤度計算部と、
前記変換尤度計算部が計算した変換尤度を参照して前記他の言語の最尤音素シーケンスを決定し、出力する最尤音素シーケンス決定部と
を含み、
前記確率モデルは、前記元文字列および前記他の言語の各音素をアライメントしたアライメント済み事例を使用して前記元文字音素と変換先音素とを対応付けてコスト・モデルを生成し、前記コスト・モデルにしたがってアライメント前の前記元文字列のアライメントを学習させて生成した、音素シーケンスが連続する場合の遷移確率を登録する遷移確率テーブルである、
情報処理装置。 An information processing device for converting an original character string into a character string of another language,
An original character acquisition unit for acquiring the original character string;
A phoneme decomposition unit that decomposes the acquired original character string into original character phonemes with reference to the phoneme data of the original character string;
For the original character phoneme sequence generated by the phoneme decomposition unit, refer to the probability model generated by learning corresponding to the original character phoneme, and use the transition probability for successive phoneme sequences to determine the conversion likelihood. A conversion likelihood calculation unit to calculate,
A maximum likelihood phoneme sequence determination unit that determines and outputs a maximum likelihood phoneme sequence of the other language with reference to the conversion likelihood calculated by the conversion likelihood calculation unit;
Including
The probabilistic model generates a cost model by associating the original character phoneme with the conversion destination phoneme using an aligned case in which the original character string and the phonemes of the other languages are aligned, and generating the cost model. A transition probability table for registering transition probabilities when phoneme sequences are generated by learning the alignment of the original character string before alignment according to a model.
Information processing device.
を含む請求項1に記載の情報処理装置。 Including a preprocessor for generating the probability model, wherein the preprocessor associates the original character phoneme with the destination phoneme using an aligned case in which the original character string and the phonemes of the other languages are aligned. A cost model generating unit for generating a cost model, an alignment processing unit for learning the alignment of the original character string before alignment according to the cost model and generating the probability model, and the alignment processing The information processing apparatus according to claim 1, further comprising: a probability model generation unit that calculates the transition probability using an output of a unit and registers the transition probability as a transition probability table.
前記元文字列を、元文字の音素データを登録する音素データ格納部から読出し、元文字音素に対応し、学習により生成した確率モデルを確率モデル格納部から読出すステップと、
前記元文字列を取得するステップと、
取得した前記元文字列を、前記音素データを参照して前記元文字音素に分解するステップと、
前記分解するステップが生成した前記元文字音素のシーケンスについて、前記確率モデルを参照して前記元文字列の先頭から末尾まで演算処理して、連続する音素シーケンスについての遷移確率を使用して変換尤度を計算するステップと、
前記計算するステップが計算した変換尤度を参照して最尤音素シーケンスを決定し出力するステップと
を実行し、
前記確率モデルが、前記元文字列および前記他の言語の各音素をアライメントしたアライメント済み事例を使用して前記元文字音素と変換先音素とを対応付けてコスト・モデルを生成し、前記コスト・モデルにしたがってアライメント前の前記元文字列のアライメントを学習させて生成した、音素シーケンスが連続する場合の遷移確率を登録する遷移確率テーブルとされる、文字列変換方法。 A character string conversion method executed by an information processing device for converting an original character string into a character string of another language,
Reading the original character string from a phoneme data storage unit for registering phoneme data of the original character, reading out a probability model corresponding to the original character phoneme and generated by learning from the probability model storage unit;
Obtaining the original character string;
Decomposing the acquired original character string into the original character phonemes with reference to the phoneme data;
The original character phoneme sequence generated by the decomposing step is processed from the beginning to the end of the original character string with reference to the probability model, and the conversion likelihood is calculated using the transition probability for the continuous phoneme sequence. Calculating the degree,
Determining and outputting a maximum likelihood phoneme sequence with reference to the conversion likelihood calculated by the calculating step;
Run
The probability model generates a cost model by associating the original character phoneme with the conversion destination phoneme using an aligned case in which the original character string and each phoneme of the other language are aligned, and generating the cost model A character string conversion method , which is a transition probability table for registering transition probabilities when phoneme sequences are generated, which is generated by learning alignment of the original character string before alignment according to a model .
元文字列および前記他の言語の各音素をアライメントしたアライメント済み事例を使用して元文字音素と変換先音素とを対応付けてコスト・モデルを生成し、前記コスト・モデルにしたがってアライメント前の前記元文字列のアライメントを学習させて登録し、音素シーケンスが連続する場合の遷移確率を登録する遷移確率テーブルとして確率モデルを事前生成するステップと、
前記元文字列を、元文字の音素データを登録する音素データ格納部から読出し、元文字音素に対応し、学習により生成した確率モデルを確率モデル格納部から読出すステップと、
元文字列を取得するステップと、
取得した前記元文字列を、前記音素データを参照して前記元文字音素に分解するステップと、
前記分解するステップが生成した前記元文字音素のシーケンスについて、前記確率モデルを参照して前記元文字列の先頭から末尾まで演算処理して、連続する音素シーケンスについての遷移確率を使用して変換尤度を計算するステップと、
前記計算するステップが計算した変換尤度を参照して最尤音素シーケンスを決定し出力するステップと
を実行する、
コンピュータ実行可能なプログラム。 A program for an information processing apparatus to execute a character string conversion method for converting an original character string into a character string of another language, the information processing apparatus using the program,
A cost model is generated by associating the original character phoneme with the conversion destination phoneme using the aligned example in which the original character string and the phonemes of the other languages are aligned, and the pre-alignment according to the cost model Pre-generating a probability model as a transition probability table for registering transition probabilities when phoneme sequences are continuous, by learning and registering alignment of original character strings;
Reading the original character string from a phoneme data storage unit for registering phoneme data of the original character, reading out a probability model corresponding to the original character phoneme and generated by learning from the probability model storage unit;
Obtaining an original string; and
Decomposing the acquired original character string into the original character phonemes with reference to the phoneme data;
The original character phoneme sequence generated by the decomposing step is processed from the beginning to the end of the original character string with reference to the probability model, and the conversion likelihood is calculated using the transition probability for the continuous phoneme sequence. Calculating the degree,
Performing a step of determining and outputting a maximum likelihood phoneme sequence with reference to the conversion likelihood calculated by the calculating step;
A computer executable program.
前記ネットワークを介して元文字列を含む要求を受領するためのネットワーク・アダプタと、
前記元文字列を前記要求から取得する元文字列取得部と、
前記元文字列を元文字音素に分解する音素分解部と、
前記音素分解部が生成した前記元文字音素のシーケンスについて、前記元文字音素に対応し、学習により生成された確率モデルを参照し、連続する音素シーケンスについての遷移確率を使用して変換尤度を計算する変換尤度計算部と、
前記変換尤度計算部が計算した変換尤度を参照して最尤音素シーケンスを決定し、前記ネットワークを介して出力する最尤音素シーケンス決定部と
を含み、
前記確率モデルが、前記元文字列および文字列変換するべき他の言語の各音素をアライメントしたアライメント済み事例を使用して前記元文字音素と変換先音素とを対応付けてコスト・モデルを生成し、前記コスト・モデルにしたがってアライメント前の前記元文字列のアライメントを学習させて生成した、音素シーケンスが連続する場合の遷移確率を登録する遷移確率テーブルである、
情報処理システム。 An information processing system for performing character string conversion via a network, wherein the information processing system includes:
A network adapter for receiving a request including the original string over the network;
An original character string acquisition unit for acquiring the original character string from the request;
A phoneme decomposition unit that decomposes the original character string into original character phonemes;
For the original character phoneme sequence generated by the phoneme decomposition unit, refer to the probability model generated by learning corresponding to the original character phoneme, and use the transition probability for successive phoneme sequences to determine the conversion likelihood. A conversion likelihood calculation unit to calculate,
A maximum likelihood phoneme sequence is determined with reference to the conversion likelihood calculated by the conversion likelihood calculation unit, and is output via the network,
The probability model generates a cost model by associating the original character phoneme with the conversion destination phoneme using an aligned example in which the original character string and each phoneme of another language to be character-string-converted are aligned. A transition probability table for registering transition probabilities in the case of continuous phoneme sequences generated by learning the alignment of the original character string before alignment according to the cost model;
Information processing system.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008168087A JP5336779B2 (en) | 2008-06-27 | 2008-06-27 | Information processing apparatus for performing character string conversion, character string conversion method, program, and information processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008168087A JP5336779B2 (en) | 2008-06-27 | 2008-06-27 | Information processing apparatus for performing character string conversion, character string conversion method, program, and information processing system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010009329A JP2010009329A (en) | 2010-01-14 |
JP5336779B2 true JP5336779B2 (en) | 2013-11-06 |
Family
ID=41589745
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008168087A Expired - Fee Related JP5336779B2 (en) | 2008-06-27 | 2008-06-27 | Information processing apparatus for performing character string conversion, character string conversion method, program, and information processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5336779B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6020093B2 (en) * | 2012-11-29 | 2016-11-02 | 三菱電機株式会社 | Alphabet reading estimation device |
JP7332486B2 (en) | 2020-01-08 | 2023-08-23 | 株式会社東芝 | SYMBOL STRING CONVERTER AND SYMBOL STRING CONVERSION METHOD |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4187998B2 (en) * | 2002-05-10 | 2008-11-26 | Sumco Techxiv株式会社 | Single crystal manufacturing method and manufacturing apparatus |
-
2008
- 2008-06-27 JP JP2008168087A patent/JP5336779B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010009329A (en) | 2010-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11238845B2 (en) | Multi-dialect and multilingual speech recognition | |
US10140371B2 (en) | Providing multi-lingual searching of mono-lingual content | |
JP6493866B2 (en) | Information processing apparatus, information processing method, and program | |
JP4050755B2 (en) | Communication support device, communication support method, and communication support program | |
JP6251958B2 (en) | Utterance analysis device, voice dialogue control device, method, and program | |
US7299187B2 (en) | Voice command processing system and computer therefor, and voice command processing method | |
JP3998668B2 (en) | Morphological analyzer, method and program | |
JP3768205B2 (en) | Morphological analyzer, morphological analysis method, and morphological analysis program | |
US20170199867A1 (en) | Dialogue control system and dialogue control method | |
EP1617409B1 (en) | Multimodal method to provide input to a computing device | |
US20090182554A1 (en) | Text analysis method | |
JP7400112B2 (en) | Biasing alphanumeric strings for automatic speech recognition | |
US20210383063A1 (en) | Technology name/service name generation device and method therefor | |
JP4266222B2 (en) | WORD TRANSLATION DEVICE, ITS PROGRAM, AND COMPUTER-READABLE RECORDING MEDIUM | |
JP2017125921A (en) | Utterance selecting device, method and program | |
JP2022076439A (en) | Dialogue management | |
JP5336779B2 (en) | Information processing apparatus for performing character string conversion, character string conversion method, program, and information processing system | |
CN112634901A (en) | Voice processing method, device, equipment and storage medium | |
JP2005092682A (en) | Transliteration device and transliteration program | |
JP7102986B2 (en) | Speech recognition device, speech recognition program, speech recognition method and dictionary generator | |
JP2017167378A (en) | Word score calculation device, word score calculation method, and program | |
JPH11143493A (en) | Device and system for understanding voice word | |
JP2020140674A (en) | Answer selection device and program | |
JP5302784B2 (en) | Machine translation method and system | |
JP5348964B2 (en) | Information processing apparatus, information processing method, information processing system, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121211 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130709 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20130709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130802 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5336779 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |