JP2010109618A - Authentication device, authentication method, and program - Google Patents
Authentication device, authentication method, and program Download PDFInfo
- Publication number
- JP2010109618A JP2010109618A JP2008278893A JP2008278893A JP2010109618A JP 2010109618 A JP2010109618 A JP 2010109618A JP 2008278893 A JP2008278893 A JP 2008278893A JP 2008278893 A JP2008278893 A JP 2008278893A JP 2010109618 A JP2010109618 A JP 2010109618A
- Authority
- JP
- Japan
- Prior art keywords
- authentication
- keyword
- voice
- speaker
- voiceprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
本発明は、音声を用いて本人性を確認するための認証技術に関するものである。 The present invention relates to an authentication technique for confirming identity by using voice.
テレビショッピング等のように、ユーザからコールセンタ等に電話をかけることにより商品の販売等、何かしらの商取引を行うサービスが普及している。このようなサービスにおいては、電話の発信者が、正当にサービスを受けられる者かどうかを着信者側が確認することが重要である。 Services such as TV shopping and the like that perform some kind of commercial transaction such as sales of products by calling a call center from a user are becoming widespread. In such a service, it is important for the callee side to check whether the caller is a person who can receive the service properly.
そのために、例えば、発信者の電話番号が予め登録したユーザの電話番号と合致するかどうかを判定することにより発信者を認証することが行われる。また、ユーザに、予め登録したキーワード等を話してもらうことにより認証を行う技術もある。
しかしながら、上記従来の技術では、本人でない者が本人になりすまして本人の電話から電話をかける場合に不正を見抜くことは困難である。本人性を確認するために、声紋認証を用いることも考えられるが、声紋認証のみでは本人であるにも関わらず本人性を否定してしまうことも考えられ、声紋認証のみを用いて本人性を確認することには問題がある。 However, with the above-described conventional technique, it is difficult to detect fraud when a person who is not the person is impersonating the person and making a call from the person's own telephone. Although voiceprint authentication may be used to confirm the identity, voiceprint authentication alone may deny the identity of the person even though it is the identity of the person. There is a problem with checking.
本発明は、上記の点に鑑みてなされたものであり、電話音声により本人性を確認するための認証技術において、種々の認証方式を柔軟に組み合わせて、本人性確認の精度を向上させるための技術を提供することを目的とする。 The present invention has been made in view of the above points, and in an authentication technique for confirming identity by telephone voice, various authentication methods can be flexibly combined to improve the accuracy of identity confirmation. The purpose is to provide technology.
上記の課題を解決するために、本発明は、電話網に接続された電話端末を利用して通話を行う話者の本人性確認を行うための認証装置であって、所定の声紋情報、第1のキーワード、及び第2のキーワードを格納する格納手段と、前記電話端末から送出された前記話者の音声を前記電話網から受信する受信手段と、前記受信手段により受信した音声から声紋情報を取得し、当該声紋情報と、前記格納手段に格納された所定の声紋情報とを照合することにより声紋認証を行う声紋認証手段と、前記第1のキーワードを前記話者に発話させることを促す音声メッセージを前記電話端末に送信し、その後に前記受信手段により受信した前記話者の音声の内容が、前記格納手段に格納された第1のキーワードに該当するかどうかを判定する音声認識認証手段と、前記声紋認証手段による認証結果と、前記第1のキーワードを用いた前記音声認識認証手段による認証結果とが異なる場合に、前記第2のキーワードを前記話者に発話させることを促す音声メッセージを前記電話端末に送信し、その後に前記受信手段により受信した前記話者の音声の内容が、前記格納手段に格納された第2のキーワードに該当するかどうかを判定する音声認識認証処理を前記音声認識認証手段に実行させる認証制御手段と、を備え、前記認証制御手段が、前記第2のキーワードを用いた音声認識認証結果に基づき前記話者の本人性の判定を行うことを特徴とする認証装置として構成される。 In order to solve the above-described problems, the present invention provides an authentication device for confirming the identity of a speaker who makes a call using a telephone terminal connected to a telephone network. Storage means for storing one keyword and second keyword, receiving means for receiving the voice of the speaker transmitted from the telephone terminal from the telephone network, and voiceprint information from the voice received by the receiving means. A voiceprint authentication unit that acquires and compares the voiceprint information with predetermined voiceprint information stored in the storage unit, and voice that prompts the speaker to utter the first keyword A voice recognition authorization for determining whether or not the content of the voice of the speaker received by the receiving means after transmitting a message to the telephone terminal corresponds to the first keyword stored in the storage means; And voice that prompts the speaker to speak the second keyword when the authentication result by the voiceprint authentication unit is different from the authentication result by the voice recognition authentication unit using the first keyword. A voice recognition and authentication process for determining whether or not the content of the voice of the speaker received by the receiving means corresponds to the second keyword stored in the storage means after transmitting a message to the telephone terminal Authentication control means to be executed by the voice recognition authentication means, wherein the authentication control means determines the identity of the speaker based on a voice recognition authentication result using the second keyword. Configured as an authentication device.
前記認証制御手段は、前記第2のキーワードを用いた音声認識認証処理の際に、更に前記声紋認証手段に対して前記第2のキーワードに関わる前記話者の音声に対する声紋認証を実行させ、当該声紋認証の結果と、前記第2のキーワードを用いた音声認識認証処理の結果とに基づき、前記話者の本人性の判定を行うこととしてもよい。 The authentication control unit causes the voiceprint authentication unit to further execute voiceprint authentication for the voice of the speaker related to the second keyword in the voice recognition authentication process using the second keyword, The identity of the speaker may be determined based on the result of voiceprint authentication and the result of voice recognition authentication processing using the second keyword.
前記受信手段により受信する前記話者の音声における無音区間の継続時間又は無音区間の回数に基づき前記話者の会話の安定度を判定し、更に、前記話者の音声から所定の特徴量を抽出し、当該特徴量を用いて前記話者の興奮度を判定し、前記安定度と前記興奮度の両方又はいずれか1つに基づき、オペレータを介して前記話者の本人性を確認するオペレータ認証に移行するか否かを判定するオペレータ認証判定手段を更に備えることとしてもよい。 Based on the duration of a silent period or the number of silent periods in the voice of the speaker received by the receiving means, the conversation stability of the speaker is determined, and a predetermined feature amount is extracted from the voice of the speaker And determining the speaker's excitement level using the feature amount, and confirming the speaker's identity through an operator based on both the stability and / or the excitement level Operator authentication determination means for determining whether or not to move to may be further provided.
また、前記格納手段は、複数の登録ユーザの電話番号を更に格納しており、前記認証装置は、前記電話端末の電話番号を前記電話網から受信する電話番号受信手段と、前記電話番号受信手段により受信した前記電話端末の電話番号が、前記格納手段に格納されているか否かを判定することにより電話端末認証を行う電話端末認証手段と、を更に備え、前記認証装置は、前記電話端末認証手段による電話端末認証に成功した場合にのみ、前記声紋認証手段及び前記音声認識認証手段を用いた認証処理を行うこととしてもよい。 The storage means further stores telephone numbers of a plurality of registered users, and the authentication device includes a telephone number receiving means for receiving the telephone number of the telephone terminal from the telephone network, and the telephone number receiving means. Telephone terminal authentication means for performing telephone terminal authentication by determining whether or not the telephone number of the telephone terminal received by the storage means is stored in the storage means, and the authentication device comprises the telephone terminal authentication Only when the telephone terminal authentication by the means is successful, an authentication process using the voiceprint authentication means and the voice recognition authentication means may be performed.
本発明によれば、音声により本人性を確認するための認証技術において、種々の認証方式を柔軟に組み合わせることにより、本人性確認の精度を向上させることが可能になる。また、話者の音声からオペレータ認証要否を判定し、自動的にオペレータ認証に移行することが可能となる。 According to the present invention, in the authentication technique for confirming the identity by voice, it is possible to improve the accuracy of the identity confirmation by flexibly combining various authentication methods. Further, it is possible to determine whether or not operator authentication is necessary from the voice of the speaker and automatically shift to operator authentication.
以下、図面を参照して本発明の実施の形態について説明する。 Embodiments of the present invention will be described below with reference to the drawings.
(システム構成)
図1は、本発明の実施の形態に係るシステムの構成図である。図1に示すように、本実施の形態に係るシステムは、発信者端末1、着信者端末2、オペレータ端末3及び認証装置4が電話網5を介して接続された構成をとる。また、電話網5は、通話制御装置6を備えている。
(System configuration)
FIG. 1 is a configuration diagram of a system according to an embodiment of the present invention. As shown in FIG. 1, the system according to the present embodiment has a configuration in which a
発信者端末1、着信者端末2、及びオペレータ端末3は、電話網5を介して通話を行うために使用される一般的な電話機である。なお、着信者端末2は、自動的に受注業務等を行う自動音声応答システムでもよい。電話網5は、固定電話網、携帯電話網、VoIP網のいずれでもよく、特定の方式に限定されるものではない。
The
通話制御装置6は、発信者番号や通話音声を認証装置4に送信したり、認証装置4からの指示に基き、呼の接続制御等を行うための装置である。このような通話制御装置6の通話制御動作は従来技術を用いて実現できる。
The
認証装置4は、本発明に係る認証処理を行う装置である。図2に、認証装置4の機能構成図を示す。
The
図2に示すように、本実施の形態に係る認証装置4は、送受信部41、端末認証部42、音声認識認証部43、声紋認証部44、オペレータ認証判定部45、認証制御部46、及びユーザ情報格納部47を有する。
As shown in FIG. 2, the
送受信部41は、通話制御装置6から電話番号、音声等を受信したり、呼接続の制御等を行うための制御情報を通話制御装置6に送信するための機能部である。なお、音声に関しては、通話制御装置6から直接受信することに代えて、通話制御装置6による呼制御に基づき、端末から電話網5を介して直接受信することも可能である。
The transmission / reception unit 41 is a functional unit for receiving a telephone number, voice, and the like from the
端末認証部42は、通話制御装置6から、発信者端末1の電話番号を受信し、発信者端末1の電話番号に基づき、ユーザ情報格納部47に格納された情報を検索することにより、発信者端末1の電話番号が予め登録された電話番号かどうかの判定を行う機能部である。
The
音声認識認証部43は、通話制御装置6から受信する音声を音声認識技術を用いてテキストに変換し、そのテキストとユーザ情報格納部47に格納された情報とを比較することにより音声認識認証を行う機能部である。
The voice
声紋認証部44は、通話制御装置6から受信する音声から声紋(音声の特徴)を抽出し、当該声紋とユーザ情報格納部47に格納された声紋とを比較することにより、声紋認証を行う機能部である。
The
オペレータ認証判定部45は、音声認識認証/声紋認証からオペレータ認証に移行するかどうかを判定するための機能部である。認証制御部46は、各認証部に対して処理指示を行うとともに、各認証部による処理結果を取得する機能や、発信者端末1に対して発話を促すための音声メッセージを送出する機能、本人性の判定や認証継続の判定を行う機能等を有する機能部である。後述するフローチャートに示す処理は、この認証制御部46の制御により行われる。
The operator
ユーザ情報格納部47は、ユーザ情報をテーブルとして格納する機能部である。図3に、ユーザ情報格納部47が格納するテーブルの一例を示す。図3に示すように、本実施形態におけるユーザ情報格納部47には、電話番号、名前及び住所等の個人情報、キーワード1、キーワード2、及び声紋情報が対応付けて格納されている。ここで、本実施の形態におけるキーワード1は、最初の音声認識認証に用いるキーワードであり、キーワード2は、最初の音声認識認証等において認証結果が成功でなかった場合に、次の音声認識認証で用いるキーワードである。
The user
これらの情報は、例えば、ユーザ登録処理等において予め登録される情報である。また、声紋情報は、該当発話者の音声を取得する機会がある場合に、随時取得、更新することが可能になっている。 These pieces of information are information registered in advance in, for example, user registration processing. The voiceprint information can be acquired and updated as needed when there is an opportunity to acquire the voice of the corresponding speaker.
認証装置4は、CPU、メモリ等の記憶装置を有する一般的なコンピュータに、上記の機能部に対応する処理を行うためのプログラムを搭載することにより実現することが可能である。当該プログラムは、ネットワーク上のサーバからダウンロードしてコンピュータにインストールしてもよいし、プログラムが記録された記録媒体(メモリ等)からコンピュータにインストールしてもよい。
The
(システムの動作)
次に、図4に示すフローチャートを参照して、認証装置4の動作を説明する。
(System operation)
Next, the operation of the
まず、発信者端末1から着信者端末2に対して電話の発呼(電話をかけること)がなされることにより、通話制御装置6が発信者端末1の電話番号を電話網5を介して取得し、その電話番号を認証装置4に送信する。
First, when a call is made from the
認証装置4の端末認証部42は、送受信部41を介して発信者端末1の電話番号を受信する。端末認証部42は、受信した電話番号を用いてユーザ情報格納部47を検索することにより、受信した電話番号がユーザ情報格納部47に格納されているかどうか(登録されているかどうか)をチェックすることにより端末認証を行う(ステップ1)。
The
ここで、受信した電話番号がユーザ情報格納部47に格納されていなければ(ステップ2におけるNo)、発信者端末1からの着信者端末2への接続を拒否する(ステップ3)。具体的には、例えば、認証制御部46が、発信者端末1に対して着信者端末2への接続ができない旨の音声メッセージを送信するとともに、通話制御装置6に対して発信者端末1と着信者端末2との間の呼接続処理を中断する旨の指示を送る。
If the received telephone number is not stored in the user information storage unit 47 (No in step 2), the connection from the
ステップ1の端末認証の結果、受信した電話番号がユーザ情報格納部47に格納されていると判定された場合(ステップ2のYes)、認証制御部47は、発信者端末1に対し、予め登録されたキーワード1を発信者に発話させるための音声メッセージ(もちろん、キーワード1自身は含まれない)を通話制御装置6を介して送信し、音声認識認証部43に対して音声認識を行うよう指示することにより、音声認識認証処理を行う(ステップ4)。
If it is determined that the received telephone number is stored in the user
音声認識認証処理(ステップ4)において、音声認識認証部43は、上記音声メッセージに応答して発信者が発した音声を通話制御装置6を介して受信する。音声認識認証部43は、受信した音声をテキストに変換し、当該テキストと、ステップ1で確認した発信者の電話番号に対応するキーワード1とを比較することにより、発信者が発した音声がキーワード1に対応するかどうかを調べる。
In the voice recognition authentication process (step 4), the voice
音声認識認証部43により、発信者が発した音声がキーワード1に対応しないと判定された場合(音声認識認証に失敗した場合)は、ステップ3に移行し、接続を拒否する。
When the voice
音声認識認証部43により、発信者が発した音声がキーワード1に対応すると判定された場合(音声認識認証に成功した場合)には声紋認証処理が行われる(ステップ6)。
When the voice
声紋認証処理(ステップ6)において、認証制御部46は、声紋認証部44に対して声紋認証を行うよう指示する。更に、認証制御部46は、取引に関係する質問やアンケート等の音声メッセージを発信者端末1に送信することにより、発信者に対して発話を行うように促す。認証制御部46はこのような音声メッセージを、声紋認証処理の開始から予め定めた時間の間だけ送出する。これにより、予め定めた時間分発信者の発話音声を取得することが可能になる。
In the voiceprint authentication process (step 6), the
声紋認証部46は、認証制御部46からの音声メッセージに応答して発信者が発話した音声を、通話制御装置6を介して順次取得し、所定区間の音声から順次声紋を抽出し、抽出した声紋と、ユーザ情報格納部47に格納された発信者の電話番号に対応する声紋とを比較することにより、声紋認証を行う。上記のように、音声の取得は一定時間連続して行われることから、声紋の抽出及び比較も複数回行うことになり、1回だけの発話を用いて声紋認証を行う場合に比べて声紋認証を精度を上げることができる。また、ここで取得した声紋情報をユーザ情報として蓄積しておき、次回からの比較対象に用いてもよい。これにより、様々な発話音声における声紋を蓄積でき、声紋認証の精度を向上させることができる。
The
ステップ6の声紋認証の結果、声紋認証部44により、発信者の音声の声紋と、ユーザ情報格納部47に格納された発信者の電話番号に対応する声紋とが一致すると判定された場合(つまり、声紋認証に成功した場合)(ステップ7のYes)、認証制御部46は認証に成功したと判定し(ステップ8)、通話制御装置6に対して発信者端末1と着信者端末2との間の呼接続を許可する旨の通知を行う。この通知を受けた通話制御装置6は、発信者端末1と着信者端末2との間の呼接続を行う。これにより、発信者端末1と着信者端末2との間の通話が行われる。
As a result of the voiceprint authentication in
ステップ6の声紋認証の結果、声紋認証部44により、発信者の音声の声紋と、ユーザ情報格納部47に格納された発信者の電話番号に対応する声紋とが一致しないと判定された場合(つまり、声紋認証に失敗した場合)、ステップ3に進み、接続を拒否することとしてもよいが、本実施の形態では、ステップ9に進み、更に認証を継続することとしている。
When the
すなわち、声紋認証では、正しい発信者であっても声の調子などにより、認証に失敗する可能性が比較的高い。一方、この段階では、端末認証とキーワード認証共に成功しており発信者は本人である可能性が高い。従って、ステップ6の声紋認証に失敗した段階で接続を拒否してしまうと、正しい発信者であるにも関わらず、接続を拒否してしまう場合が生じ得る。そのような場合をできるだけ無くすために、本実施の形態では、ステップ7において声紋認証に失敗した場合には更に認証を継続することとしている。もちろん、なりすましをできるだけ排除するという観点から、ステップ6の声紋認証に失敗した場合に接続を拒否する処理を行うことも可能である。
That is, in voiceprint authentication, even a correct caller is relatively likely to fail authentication due to the tone of the voice. On the other hand, at this stage, both terminal authentication and keyword authentication have succeeded, and the sender is highly likely to be the person. Therefore, if the connection is rejected at the stage where the voiceprint authentication in
なお、上記の処理例では、音声認証認識(キーワード認証)に成功し、声紋認証に失敗した場合にステップ9に移ることとしているが、音声認証認識が失敗した場合に、接続を拒否しないで、声紋認証に移り、ここで声紋認証に失敗した場合にはじめて接続を拒絶し、ここで声紋認証に成功した場合に、ステップ9に移ることとしてもよい。 In the above processing example, if the voice authentication recognition (keyword authentication) succeeds and the voiceprint authentication fails, the process proceeds to step 9. If the voice authentication recognition fails, the connection is not rejected. It moves to voiceprint authentication, and when voiceprint authentication fails here, connection is refused for the first time, and when voiceprint authentication is successful here, it is good also as moving to step 9. FIG.
次に、ステップ9の処理について説明する。
Next, the process of
ステップ9においては、ステップ9において用いたキーワード1とは別のキーワード2を用いた音声認識認証を行うとともに、キーワード2に対応する発話音声に基づく声紋認証も行う。
In
ここでは、まず、認証制御部46が、発信者に対してキーワード2の発話を要求する音声メッセージ(もちろん、キーワード2自身は含まれない)を通話制御装置6を介して発信者端末1に送信するとともに、音声認識認証部43と、声紋認証部44に対してそれぞれの認証処理を行う旨の指示を行う。
Here, first, the
音声認識認証部43は、キーワード2の発話を要求する音声メッセージに応答して発信者から発せられた音声を受信し、それをテキストに変換し、当該テキストと、ユーザ情報格納部47に格納された発信者の電話番号に対応するキーワード2とを比較し、当該テキストがキーワード2に一致するかどうかを調べることにより音声認識認証を行う。
The voice recognition /
声紋認証部44も発信者から発せられた音声を受信し、当該音声から声紋を抽出し、抽出した声紋と、ユーザ情報格納部47に格納された発信者の電話番号に対応する声紋とを比較し、これらが一致するかどうかを調べることにより声紋認証を行う。
The
もちろん、ここでの声紋認証においても、一定時間発信者に発話を行わせるためのメッセージを認証制御部46が送信し、それに応答して発信者から発話された音声に基づき声紋認証を行うこととしてもよい。
Of course, also in the voiceprint authentication here, the
ステップ9の音声認識認証と声紋認証の結果、音声認識認証と声紋認証の両方に失敗した場合(ステップ10の"両方失敗")、ステップ3に移り、認証制御部46は、接続を拒否するための処理を行う。音声認識認証と声紋認証の両方に成功した場合(ステップ10の"両方成功")、認証制御部46は、認証に成功したと判断して、ステップ8に移り、接続のための処理を行う。
If both voice recognition authentication and voiceprint authentication fail as a result of the voice recognition authentication and voiceprint authentication in step 9 (“both failed” in step 10), the process proceeds to step 3 and the
また、本実施形態では、音声認識認証と声紋認証のうちのいずれか一方において失敗した場合(ステップ10の"1つ失敗")、オペレータ認証を行うこととしている(ステップ11)。すなわち、この場合、認証制御部46が、通話制御装置6に対して発信者端末1とオペレータ端末3とを接続する旨の指示を送信する。当該指示を受けた通話制御装置6は、発信者端末1とオペレータ端末3とを接続するための制御を行う。発信者端末1とオペレータ端末3が接続された後は、オペレータ端末3のオペレータが、発信者と会話を行うことにより本人性を確認する。このとき、発信者端末1とオペレータ端末3間でやりとりされる音声を認証装置4が取得し、更に声紋認証を行ったり、録音を行ったりしてもよい。オペレータの判断により本人性が確認されれば、ステップ8に移り、発信者端末1と着信者端末2との間の通話が行われることになる。
Further, in the present embodiment, when one of voice recognition authentication and voiceprint authentication fails (“one failure” in step 10), operator authentication is performed (step 11). That is, in this case, the
(オペレータ認証移行判定のための処理例)
上記の処理例では、ステップ9の音声認識認証・声紋認証処理において、音声認識認証と声紋認証のうちのいずれか一方が失敗した場合にオペレータ認証に移行することとしていたが、最初の声紋認証(ステップ6)の段階で、所定の条件を満たす場合にオペレータ認証に移行することとしてもよい。
(Processing example for determining operator authentication)
In the above processing example, in the voice recognition authentication / voiceprint authentication process in
この処理を行う場合、図4の処理フローにおけるステップ6の処理とステップ7の判定処理のみが異なってくる。以下、本例でのステップ6、ステップ7の処理を説明する。
When this processing is performed, only the processing in
ステップ6において、声紋認証部44は、図4の場合と同様にして声紋認証処理を行う。更に、本例では、この声紋認証処理と並行して、オペレータ認証判定部45が発信者の音声を順次取得しながら、以下の処理を行う。
In
オペレータ認証判定部45は、予め定めた時間の間発信者が発話を行う中で、発信者の音声における無音区間の継続時間を測定する。例えば、図5の場合であれば、無音区間の継続時間は8秒である。一定時間内において無音区間が長いということは、発信者が会話を安定して行うことができていないことを示していることから、無音区間の継続時間を調べることにより、発信者の安定度をチェックすることができる。ここでは、例えば、無音区間の継続時間と安定度の数値とを対応付けたテーブルを予め認証装置4の記憶装置内に備えておき、オペレータ認証判定部45は、実際に測定した無音区間の継続時間に対応する安定度を上記テーブルから取得する。無音区間の継続時間に代えて、無音区間の回数により安定度を判定してもよい。
The operator
更に、オペレータ認証判定部45は、予め定めた時間の間順次取得する音声の中から発信者の興奮度を示す特徴量を抽出し、発信者の興奮度を判定する。興奮度を示す特徴量としては、発信者の音声の周波数、リズム、強弱等がある。そして、例えば、興奮度を示す特徴量の値と、興奮度の数値とを対応付けたテーブルを予め認証装置4の記憶装置内に備えておき、オペレータ認証判定部45は、実際に測定した特徴量に対応する興奮度を上記テーブルから取得する。なお、音声の周波数、リズム、強弱等から発話者の興奮度を推定する技術自体は既存技術である。
Further, the operator
ステップ7において、オペレータ認証判定部45は、声紋認証部44による声紋認証結果がOKか否かをチェックする。OKであれば、認証成功とし、ステップ8に進む。声紋認証部44による声紋認証結果がNGの場合、オペレータ認証判定部45は、ステップ6で求めた安定度と興奮度の合計を予め定めた閾値と比較し、安定度と興奮度の合計が当該閾値以上であればオペレータ認証に移行する(ステップ11へ)。具体的には、この場合、オペレータ認証判定部45は、オペレータ認証に移行するよう認証制御部46に通知を行い、認証制御部46が通話制御装置6に対して発信者端末1とオペレータ端末3間の接続指示を行う。また、安定度と興奮度の合計が当該閾値未満であれば前述したステップ9に移行する。
In step 7, the operator
なお、上記の例では、安定度と興奮度の合計に基づきオペレータ認証への移行を判定していたが、安定度と興奮度についてそれぞれ閾値を設け、いずれか一方、又は両方が閾値以上になった場合にオペレータ認証へ移行することとしてもよい。 In the above example, the transition to the operator authentication is determined based on the sum of the stability and the excitement level. However, a threshold is set for each of the stability and the excitement level, and either one or both are equal to or more than the threshold value. It is also possible to shift to operator authentication in the case of
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。 The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.
1 発信者端末
2 着信者端末
3 オペレータ端末
4 認証装置
5 電話網
6 通話制御装置
41 送受信部
42 端末認証部
43 音声認識認証部
44 声紋認証部
45 オペレータ認証判定部
46 認証制御部
47 ユーザ情報格納部
DESCRIPTION OF
Claims (6)
所定の声紋情報、第1のキーワード、及び第2のキーワードを格納する格納手段と、
前記電話端末から送出された前記話者の音声を前記電話網から受信する受信手段と、
前記受信手段により受信した音声から声紋情報を取得し、当該声紋情報と、前記格納手段に格納された所定の声紋情報とを照合することにより声紋認証を行う声紋認証手段と、
前記第1のキーワードを前記話者に発話させることを促す音声メッセージを前記電話端末に送信し、その後に前記受信手段により受信した前記話者の音声の内容が、前記格納手段に格納された第1のキーワードに該当するかどうかを判定する音声認識認証手段と、
前記声紋認証手段による認証結果と、前記第1のキーワードを用いた前記音声認識認証手段による認証結果とが異なる場合に、前記第2のキーワードを前記話者に発話させることを促す音声メッセージを前記電話端末に送信し、その後に前記受信手段により受信した前記話者の音声の内容が、前記格納手段に格納された第2のキーワードに該当するかどうかを判定する音声認識認証処理を前記音声認識認証手段に実行させる認証制御手段と、を備え、
前記認証制御手段が、前記第2のキーワードを用いた音声認識認証結果に基づき前記話者の本人性の判定を行うことを特徴とする認証装置。 An authentication device for confirming the identity of a speaker who makes a call using a telephone terminal connected to a telephone network,
Storage means for storing predetermined voiceprint information, a first keyword, and a second keyword;
Receiving means for receiving the voice of the speaker transmitted from the telephone terminal from the telephone network;
Voiceprint authentication means for acquiring voiceprint information from the voice received by the receiving means, and performing voiceprint authentication by comparing the voiceprint information with predetermined voiceprint information stored in the storage means;
A voice message prompting the speaker to utter the first keyword is transmitted to the telephone terminal, and then the content of the voice of the speaker received by the receiving means is stored in the storage means. Speech recognition and authentication means for determining whether or not the keyword corresponds to one keyword;
When the authentication result by the voiceprint authentication means is different from the authentication result by the voice recognition authentication means using the first keyword, a voice message that prompts the speaker to speak the second keyword A voice recognition authentication process for determining whether a content of the voice of the speaker transmitted to the telephone terminal and then received by the receiving means corresponds to a second keyword stored in the storage means; An authentication control means to be executed by the authentication means,
The authentication apparatus, wherein the authentication control means determines the identity of the speaker based on a voice recognition authentication result using the second keyword.
前記電話端末の電話番号を前記電話網から受信する電話番号受信手段と、
前記電話番号受信手段により受信した前記電話端末の電話番号が、前記格納手段に格納されているか否かを判定することにより電話端末認証を行う電話端末認証手段と、を更に備え、
前記認証装置は、前記電話端末認証手段による電話端末認証に成功した場合にのみ、前記声紋認証手段及び前記音声認識認証手段を用いた認証処理を行うことを特徴とする請求項1ないし3のうちいずれか1項に記載の認証装置。 The storage means further stores a plurality of registered user telephone numbers, and the authentication device includes:
Telephone number receiving means for receiving the telephone number of the telephone terminal from the telephone network;
Telephone terminal authentication means for performing telephone terminal authentication by determining whether or not the telephone number of the telephone terminal received by the telephone number receiving means is stored in the storage means;
4. The authentication apparatus according to claim 1, wherein the authentication device performs an authentication process using the voiceprint authentication unit and the voice recognition authentication unit only when the telephone terminal authentication by the telephone terminal authentication unit is successful. The authentication device according to any one of claims.
前記電話端末から送出された前記話者の音声を前記電話網から受信する受信ステップと、
声紋認証手段が、前記受信手段により受信した音声から声紋情報を取得し、当該声紋情報と、前記格納手段に格納された所定の声紋情報とを照合することにより声紋認証を行う声紋認証ステップと、
音声認識認証手段が、前記第1のキーワードを前記話者に発話させることを促す音声メッセージを前記電話端末に送信し、その後に送信前記受信手段により受信した前記話者の音声の内容が、前記格納手段に格納された第1のキーワードに該当するかどうかを判定する第1の音声認識認証ステップと、
前記声紋認証ステップでの認証結果と、前記第1のキーワードを用いた前記第1の音声認識認証ステップでの認証結果とが異なる場合に、前記音声認識認証手段が、前記第2のキーワードを前記話者に発話させることを促す音声メッセージを前記電話端末に送信し、その後に前記受信手段により受信した前記話者の音声の内容が、前記格納手段に格納された第2のキーワードに該当するかどうかを判定する第2の音声認識認証ステップと、
前記第2の音声認識認証ステップにおける音声認識認証結果に基づき前記話者の本人性の判定を行うステップと、
を有することを特徴とする認証方法。 An authentication method executed by an authentication apparatus for confirming the identity of a speaker who makes a call using a telephone terminal connected to a telephone network, wherein the authentication apparatus includes predetermined voiceprint information, a first keyword , And storage means for storing the second keyword, the authentication method comprising:
Receiving the voice of the speaker sent from the telephone terminal from the telephone network;
A voiceprint authenticating step for acquiring voiceprint information from the voice received by the receiving means and performing voiceprint authentication by comparing the voiceprint information with predetermined voiceprint information stored in the storage means;
The voice recognition and authentication means transmits a voice message prompting the speaker to utter the first keyword to the telephone terminal, and then transmits the voice content of the speaker received by the receiving means. A first speech recognition and authentication step for determining whether or not the first keyword stored in the storage means corresponds;
When the authentication result in the voiceprint authentication step is different from the authentication result in the first voice recognition authentication step using the first keyword, the voice recognition authentication means sets the second keyword as the second keyword. Whether a voice message prompting a speaker to speak is transmitted to the telephone terminal, and then the content of the voice of the speaker received by the receiving unit corresponds to the second keyword stored in the storage unit A second speech recognition and authentication step for determining whether or not;
Determining the identity of the speaker based on a speech recognition authentication result in the second speech recognition authentication step;
An authentication method characterized by comprising:
前記電話端末から送出された前記話者の音声を前記電話網から受信する受信手段、
前記受信手段により受信した音声から声紋情報を取得し、当該声紋情報と、前記格納手段に格納された所定の声紋情報とを照合することにより声紋認証を行う声紋認証手段、
前記第1のキーワードを前記話者に発話させることを促す音声メッセージを前記電話端末に送信し、その後に前記受信手段により受信した前記話者の音声の内容が、前記格納手段に格納された第1のキーワードに該当するかどうかを判定する音声認識認証手段、
前記声紋認証手段による認証結果と、前記第1のキーワードを用いた前記音声認識認証手段による認証結果とが異なる場合に、前記第2のキーワードを前記話者に発話させることを促す音声メッセージを前記電話端末に送信し、その後に前記受信手段により受信した前記話者の音声の内容が、前記格納手段に格納された第2のキーワードに該当するかどうかを判定する音声認識認証処理を前記音声認識認証手段に実行させ、前記第2のキーワードを用いた音声認識認証結果に基づき前記話者の本人性の判定を行う認証制御手段、
として機能させるプログラム。 In order to confirm the identity of a speaker who makes a call using a telephone terminal connected to a telephone network, a computer having storage means for storing predetermined voiceprint information, a first keyword, and a second keyword. A program for causing the computer to function as an authentication device of
Receiving means for receiving the voice of the speaker transmitted from the telephone terminal from the telephone network;
Voiceprint authentication means for acquiring voiceprint information from the voice received by the receiving means, and performing voiceprint authentication by comparing the voiceprint information with predetermined voiceprint information stored in the storage means;
A voice message prompting the speaker to utter the first keyword is transmitted to the telephone terminal, and then the content of the voice of the speaker received by the receiving means is stored in the storage means. Voice recognition and authentication means for determining whether or not the keyword corresponds to one keyword;
When the authentication result by the voiceprint authentication means is different from the authentication result by the voice recognition authentication means using the first keyword, a voice message that prompts the speaker to speak the second keyword A voice recognition authentication process for determining whether a content of the voice of the speaker transmitted to the telephone terminal and then received by the receiving means corresponds to a second keyword stored in the storage means; Authentication control means for causing the authentication means to perform determination of the identity of the speaker based on a voice recognition authentication result using the second keyword;
Program to function as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008278893A JP2010109618A (en) | 2008-10-29 | 2008-10-29 | Authentication device, authentication method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008278893A JP2010109618A (en) | 2008-10-29 | 2008-10-29 | Authentication device, authentication method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010109618A true JP2010109618A (en) | 2010-05-13 |
Family
ID=42298626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008278893A Pending JP2010109618A (en) | 2008-10-29 | 2008-10-29 | Authentication device, authentication method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010109618A (en) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014085913A (en) * | 2012-10-25 | 2014-05-12 | Ntt Communications Corp | Authentication device, authentication method, and authentication program |
CN104732974A (en) * | 2013-12-19 | 2015-06-24 | 国家电网公司 | Intelligent recording and recognizing system |
JP2016053598A (en) * | 2014-09-02 | 2016-04-14 | 株式会社Kddiテクノロジー | Communication device, method and program for registering voice print |
JP2016071050A (en) * | 2014-09-29 | 2016-05-09 | シャープ株式会社 | Voice interactive device, voice interactive system, terminal, voice interactive method, program for letting computer function as voice interactive device |
CN105814535A (en) * | 2013-09-25 | 2016-07-27 | 亚马逊技术股份有限公司 | In-call virtual assistants |
JP2017068243A (en) * | 2014-06-24 | 2017-04-06 | グーグル インコーポレイテッド | Dynamic threshold for speaker verification |
JP2017103590A (en) * | 2015-12-01 | 2017-06-08 | Necエンジニアリング株式会社 | Device, system and program for user identification |
JP6321864B1 (en) * | 2017-07-12 | 2018-05-09 | 株式会社アセンド | Multi-step authentication processing system |
WO2020171040A1 (en) * | 2019-02-18 | 2020-08-27 | 日本電気株式会社 | Voice authentication apparatus, voice authentication method and recording medium |
CN111613228A (en) * | 2020-04-15 | 2020-09-01 | 上海雷尘智能科技有限公司 | Identity and content recognition system based on voiceprint codes |
JP6992146B1 (en) | 2020-10-06 | 2022-01-13 | 株式会社セレンディピティー | Information processing system, information processing method and program |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007052496A (en) * | 2005-08-15 | 2007-03-01 | Advanced Media Inc | User authentication system and user authentication method |
-
2008
- 2008-10-29 JP JP2008278893A patent/JP2010109618A/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007052496A (en) * | 2005-08-15 | 2007-03-01 | Advanced Media Inc | User authentication system and user authentication method |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014085913A (en) * | 2012-10-25 | 2014-05-12 | Ntt Communications Corp | Authentication device, authentication method, and authentication program |
US10134395B2 (en) | 2013-09-25 | 2018-11-20 | Amazon Technologies, Inc. | In-call virtual assistants |
CN105814535A (en) * | 2013-09-25 | 2016-07-27 | 亚马逊技术股份有限公司 | In-call virtual assistants |
JP2016533690A (en) * | 2013-09-25 | 2016-10-27 | アマゾン テクノロジーズ インコーポレイテッド | Virtual assistant during a call |
CN105814535B (en) * | 2013-09-25 | 2019-12-03 | 亚马逊技术股份有限公司 | Virtual assistant in calling |
CN104732974A (en) * | 2013-12-19 | 2015-06-24 | 国家电网公司 | Intelligent recording and recognizing system |
US9972323B2 (en) | 2014-06-24 | 2018-05-15 | Google Llc | Dynamic threshold for speaker verification |
JP2017068243A (en) * | 2014-06-24 | 2017-04-06 | グーグル インコーポレイテッド | Dynamic threshold for speaker verification |
JP2016053598A (en) * | 2014-09-02 | 2016-04-14 | 株式会社Kddiテクノロジー | Communication device, method and program for registering voice print |
JP2016071050A (en) * | 2014-09-29 | 2016-05-09 | シャープ株式会社 | Voice interactive device, voice interactive system, terminal, voice interactive method, program for letting computer function as voice interactive device |
JP2017103590A (en) * | 2015-12-01 | 2017-06-08 | Necエンジニアリング株式会社 | Device, system and program for user identification |
JP6321864B1 (en) * | 2017-07-12 | 2018-05-09 | 株式会社アセンド | Multi-step authentication processing system |
JP2019020823A (en) * | 2017-07-12 | 2019-02-07 | 株式会社アセンド | Multi-step authentication processing system |
JP7215563B2 (en) | 2019-02-18 | 2023-01-31 | 日本電気株式会社 | Voice authentication device, voice authentication method, and recording medium |
CN113454711A (en) * | 2019-02-18 | 2021-09-28 | 日本电气株式会社 | Voice authentication device, voice authentication method, and recording medium |
JPWO2020171040A1 (en) * | 2019-02-18 | 2021-12-16 | 日本電気株式会社 | Voice authentication device, voice authentication method, and recording medium |
WO2020171040A1 (en) * | 2019-02-18 | 2020-08-27 | 日本電気株式会社 | Voice authentication apparatus, voice authentication method and recording medium |
CN111613228A (en) * | 2020-04-15 | 2020-09-01 | 上海雷尘智能科技有限公司 | Identity and content recognition system based on voiceprint codes |
JP6992146B1 (en) | 2020-10-06 | 2022-01-13 | 株式会社セレンディピティー | Information processing system, information processing method and program |
JP2022061448A (en) * | 2020-10-06 | 2022-04-18 | 株式会社セレンディピティー | Information processing system, information processing method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010109618A (en) | Authentication device, authentication method, and program | |
US11210461B2 (en) | Real-time privacy filter | |
EP3158719B1 (en) | Method and system for filtering undesirable incoming telephone calls | |
US8885797B2 (en) | Systems and methods for providing network-based voice authentication | |
EP3050051B1 (en) | In-call virtual assistants | |
US8515025B1 (en) | Conference call voice-to-name matching | |
US7920680B2 (en) | VoIP caller authentication by voice signature continuity | |
US20030074201A1 (en) | Continuous authentication of the identity of a speaker | |
JP2010109619A (en) | Authentication device, authentication method, and program | |
US10614813B2 (en) | System and method for performing caller identity verification using multi-step voice analysis | |
US20190378520A1 (en) | System For Determining Identity Based On Voiceprint And Voice Password, And Method Thereof | |
JP2009508144A (en) | Biometric voiceprint authentication method and biometric voiceprint authentication device | |
JP2007052496A (en) | User authentication system and user authentication method | |
US20160098995A1 (en) | Speech to text training method and system | |
AU2012205747B2 (en) | Natural enrolment process for speaker recognition | |
US20150056952A1 (en) | Method and apparatus for determining intent of an end-user in a communication session | |
CN107172620B (en) | Wireless local area network authentication method and device | |
KR20200006204A (en) | Method for user authentication using data extracting | |
JP2014072701A (en) | Communication terminal | |
JP3727927B2 (en) | Speaker verification device | |
KR101820119B1 (en) | Method, communication relay apparatus and terminal unit for real-time voice phishing analysis service | |
JP5728456B2 (en) | Communication terminal | |
JP5143062B2 (en) | Method for determining illegal call from malicious third party and automatic telephone answering device | |
EP4002900A1 (en) | Method and device for multi-factor authentication with voice based authentication | |
KR102204416B1 (en) | Authentication service method based on voice |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110222 |