JP7044040B2 - 質問応答装置、質問応答方法及びプログラム - Google Patents

質問応答装置、質問応答方法及びプログラム Download PDF

Info

Publication number
JP7044040B2
JP7044040B2 JP2018221944A JP2018221944A JP7044040B2 JP 7044040 B2 JP7044040 B2 JP 7044040B2 JP 2018221944 A JP2018221944 A JP 2018221944A JP 2018221944 A JP2018221944 A JP 2018221944A JP 7044040 B2 JP7044040 B2 JP 7044040B2
Authority
JP
Japan
Prior art keywords
answer
question
vehicle
voice
control information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018221944A
Other languages
English (en)
Other versions
JP2020086203A (ja
Inventor
景子 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018221944A priority Critical patent/JP7044040B2/ja
Priority to US16/582,214 priority patent/US11455338B2/en
Priority to CN201911134749.4A priority patent/CN111243581A/zh
Publication of JP2020086203A publication Critical patent/JP2020086203A/ja
Application granted granted Critical
Publication of JP7044040B2 publication Critical patent/JP7044040B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Navigation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stereophonic System (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Description

本発明は、質問応答装置、質問応答方法及びプログラムに関する。
従来、車載器に対して質問を音声入力すると、当該質問に対する回答が音声によって車両内のスピーカから出力される技術が検討されている(例えば、特許文献1)。
特開2015-28566号公報
しかしながら、例えば、車両の或る機能の操作方法に関する質問に対する回答が音声で出力される場合、操作対象とするスイッチ類等の位置を表現するのが困難な場合がある。
例えば、「ハンドルの右下にある、クルマとメーターのマークがついているレバーです」との回答が音声で出力されると、位置を正確に伝えるに説明文が複雑になってしまっており、ユーザにとって直感的な理解が困難となる。
また、ETCカードの挿入口を回答する場合に、「グローブボックスの下にあります」という音声を出力することが考えられる。この場合、説明文は簡潔であるが、ユーザがグローブボックスの名称を知らない場合には、ユーザは回答を理解することができず、結果的に回答に関連する位置を把握することができない。
本発明は、上記の点に鑑みてなされたものであって、車両内での質問に対する回答に関連する位置を把握しやすくすることを目的とする。
本発明の実施の形態の質問応答装置は、
車両内において発声される音声を受け付ける受付部と、
音声認識に基づいて前記音声が示す文字列を生成する生成部と、
前記文字列が示す質問に対する回答を取得する第1の取得部と、
前記回答の音声を前記車両内において当該回答に関連する位置に定位させるための制御情報を取得する第2の取得部と、
前記制御情報を出力する出力部と、
を有する。
このため、質問に対する回答の音声が、立体音響によって当該回答に関連する位置に定位される。
したがって、車両内での質問に対する回答に関連する位置を把握しやすくすることができる。
本発明の他の実施の形態の質問応答装置では、
前記第2の取得部は、前記質問が車両のいずれかの位置に関する質問である場合に、前記制御情報を取得する。
このため、車両のいずれかの位置に関する質問に対する回答の音声が、立体音響によって当該回答に関連する位置に定位される。
したがって、車両内での質問に対する回答に関連する位置を把握しやすくすることができる。
本発明の他の実施の形態の質問応答装置では、
前記出力部は、前記回答に関連する位置に対応するインジケータの点灯命令を出力する。
このため、質問に対する回答に関連する位置に対応する車両内のインジケータが点灯される。
したがって、車両内での質問に対する回答に関連する位置を把握しやすくすることができる。
本発明の実施の形態の質問応答方法は、
車両内において発声される音声を受け付ける受付手順と、
音声認識に基づいて前記音声が示す文字列を生成する生成手順と、
前記文字列が示す質問に対する回答を取得する第1の取得手順と、
前記回答の音声を前記車両内において当該回答に関連する位置に定位させるための制御情報を取得する第2の取得手順と、
前記制御情報を出力する出力手順と、
をコンピュータが実行する。
このため、質問に対する回答の音声が、立体音響によって当該回答に関連する位置に定位される。
したがって、車両内での質問に対する回答に関連する位置を把握しやすくすることができる。
本発明の実施の形態のプログラムは、
車両内において発声される音声を受け付ける受付手順と、
音声認識に基づいて前記音声が示す文字列を生成する生成手順と、
前記文字列が示す質問に対する回答を取得する第1の取得手順と、
前記回答の音声を前記車両内において当該回答に関連する位置に定位させるための制御情報を取得する第2の取得手順と、
前記制御情報を出力する出力手順と、
をコンピュータに実行させる。
このため、質問に対する回答の音声が、立体音響によって当該回答に関連する位置に定位される。
したがって、車両内での質問に対する回答に関連する位置を把握しやすくすることができる。
車両内での質問に対する回答に関連する位置を把握しやすくすることができる。
第1の実施の形態における質問応答システムの構成例を示す図である。 第1の実施の形態におけるサーバ装置10のハードウェア構成例を示す図である。 第1の実施の形態における車載器30及びサーバ装置10の機能構成例を示す図である。 第1の実施の形態において車載器30が実行する処理手順の一例を説明するためのフローチャートである。 第1の実施の形態においてサーバ装置10が実行する処理手順の一例を説明するためのフローチャートである。 第1の実施の形態における質問回答DB17の構成例を示す図である。 第1の実施の形態における出力制御DB18の構成例を示す図である。 回答に関連する位置に音声が定位される例を示す図である。 第2の実施の形態における出力制御DB18の構成例を示す図である。
以下、図面に基づいて本発明の実施の形態を説明する。図1は、第1の実施の形態における質問応答システムの構成例を示す図である。図1において、質問応答システムは、サーバ装置10と1以上の車両20とを含む。
車両20は、例えば、自動車であり、車載器30、マイク40、表示装置50、及び2以上のスピーカ60等を含む。マイク40は、音声を電気信号(以下、「音声信号」という。)に変換する装置である。本実施の形態において、マイク40は、車両20内おいて車両20の乗員(運転者又は同乗者等。以下「ユーザ」という。)によって発声される、車両20の機能に関する質問の音声の集音に利用される。表示装置50は、例えば、液晶ディスプレイである。本実施の形態において、表示装置50は、質問に対する回答に関連する情報の表示に利用される。スピーカ60は、電気信号に基づいて音声を出力する装置である。本実施の形態において、スピーカ60は、質問に対する回答を示す音声の出力に利用される。なお、回答は、2以上のスピーカ60を用いた立体音響によって出力される。立体音響が用いられることで、回答を示す音声は、車両20内において回答に関連する位置に定位される。換言すれば、ユーザにとって当該位置の方向から聞こえるように回答の音声が出力される。
車載器30は、情報処理機能及び通信機能を有する装置であり、多数の基地局を末端とする無線通信網である移動体通信網やインターネット網等を含むネットワークN1を介しサーバ装置10に接続される。本実施の形態において、車載器30は、マイク40から出力される音声信号が記録されたデジタルデータ(以下、「音声データ」という。)と、車両20の車両型式を示す情報(以下、「車両型式情報」という。)とを含むデータ(以下、「質問データ」という。)をサーバ装置10へ送信する。車載器30は、また、サーバ装置10から応答される、質問に対する回答の出力の制御方法を示す情報(以下、「出力制御情報」という。)を受信する。出力制御情報には、表示に関する出力制御情報と、音声出力に関する出力制御情報とが含まれる。車載器30は、表示に関する出力制御情報(以下、「表示制御情報」という。)に基づいて、回答に関連する情報について、表示装置50での表示を制御する。また、車載器30は、音声出力に関する出力制御情報(以下、「音声制御情報」という。)に基づいて、回答を示す音声について、スピーカ60からの立体音響での出力を制御する。
サーバ装置10は、車載器30から送信される質問データが示す質問に対する回答を取得し、当該回答に関する出力制御情報を車載器30へ応答する1以上のコンピュータである。
図2は、第1の実施の形態におけるサーバ装置10のハードウェア構成例を示す図である。図2のサーバ装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、及びインタフェース装置105等を有する。
サーバ装置10での処理を実現するプログラムは、CD-ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従ってサーバ装置10に係る機能を実行する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。
図3は、第1の実施の形態における車載器30及びサーバ装置10の機能構成例を示す図である。図3において、車載器30は、質問データ送信部31、出力制御情報受信部32、音声制御部33及び表示制御部34等を有する。これら各部は、車載器30にインストールされた1以上のプログラムが、車載器30のCPUに実行させる処理により実現される。
質問データ送信部31は、マイク40から出力される音声信号に基づいて音声データを生成し、当該音声データと車両型式情報とを含む質問データをサーバ装置10へ送信する。
出力制御情報受信部32は、質問データに対してサーバ装置10から応答される出力制御情報を受信する。出力制御情報受信部32は、出力制御情報のうち、音声制御情報を音声制御部33に入力し、表示制御情報を表示制御部34に入力する。
音声制御部33は、音声制御情報に基づいて、回答を示す音声について、複数のスピーカ60からの立体音響での出力を制御する。
表示制御部34は、表示制御情報に基づいて、回答に関連する情報について、表示装置50での表示を制御する。
一方、サーバ装置10は、質問データ受信部11、音声認識部12、質問推定部13、回答検索部14、出力制御情報取得部15及び出力制御情報送信部16等を有する。これら各部は、サーバ装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。サーバ装置10は、また、質問回答DB17及び出力制御DB18等のデータベース(記憶部)Yを利用する。これら各データベースは、例えば、補助記憶装置102、又はサーバ装置10にネットワークを介して接続可能な記憶装置等を用いて実現可能である。
質問データ受信部11は、車載器30から送信される質問データを受信する。音声認識部12は、質問データに含まれる音声データが示す音声について音声認識を実行し、当該音声が示す文字列(テキストデータ)を生成する。
質問推定部13は、テキストデータの内容が示す質問(の意図)を推定する。具体的には、質問推定部13は、テキストデータの内容が、予め想定されている複数の質問のうちのいずれの質問であるのかを推定する。
回答検索部14は、質問推定部13によって推定された質問に対する回答と、当該回答に関連する機能(車両20に関する機能)の名称(以下、「機能名」という。)とを質問回答DB17から取得する。すなわち、質問回答DB17には、予め想定されている複数の質問のそれぞれに対応付けて回答及び機能名が記憶されている。
出力制御情報取得部15は、回答検索部14によって取得されて機能名に関する出力制御情報を出力制御DB18から取得する。すなわち、出力制御DB18には、機能名ごとに、出力制御情報(音声制御情報、表示制御情報)が記憶されている。
出力制御情報送信部16は、出力制御情報取得部15によって取得された出力制御情報を質問データの送信元の車載器30へ送信する。
以下、車載器30及びサーバ装置10のそれぞれが実行する処理手順について説明する。図4は、第1の実施の形態において車載器30が実行する処理手順の一例を説明するためのフローチャートである。
ユーザによる発話の音声がマイク40によって入力されると、質問データ送信部31は、当該音声が記録された音声データを生成する(S101)。なお、全ての発話に関してステップS101以降が実行されてもよいし、ユーザが車両20内で所定の操作(例えば、所定のボタンの押下等)を行った後の発話に関してステップS101以降が実行されてもよい。前者の場合、必ずしも発話の内容が質問であるとは限らない。なお、質問データ送信部31は、発声が開始されてから、発声が一定時間以上途絶えるまでを一つの発話として認識してもよい。
続いて、質問データ送信部31は、車両20の車両型式情報を取得する(S102)。例えば、車両型式情報は、車載器30内又は車両20内の不揮発性メモリから取得されてもよい。
続いて、質問データ送信部31は、ステップS101において生成された音声データと、ステップS102において取得された車両型式情報とを含む質問データをサーバ装置10へ送信する(S103)。その後、出力制御情報受信部32は、サーバ装置10から返信される出力制御情報の受信を待機する(S104)。
出力制御情報受信部32が出力制御情報を受信すると(S104でYes)、音声制御部33は、当該出力制御情報に含まれている音声制御情報に基づいて、回答を示す音声について複数のスピーカ60を用いた立体音響での出力を制御する(S105)。
続いて、又はステップS105と並行して、表示制御部34は、当該出力制御情報に含まれている表示制御情報に基づいて、回答に関連する情報を表示装置50に表示する(S106)。
図5は、第1の実施の形態においてサーバ装置10が実行する処理手順の一例を説明するためのフローチャートである。
質問データ受信部11が、図4のステップS103において車載器30から送信された質問データを受信すると(S201)、音声認識部12は、当該質問データに含まれる音声データが示す音声について音声認識を実行し、当該音声をテキストデータに変換する(S202)。すなわち、当該音声を示すテキストデータが生成される。
続いて、質問推定部13は、テキストデータの内容が、質問回答DB17に記憶されている複数の質問のうちのいずれの質問であるのかを推定する(S203)。例えば、予め機械学習を利用して質問推定器を生成しておき、質問推定部13が、当該質問推定器を利用して質問を推定してもよい。この場合、質問推定器は、車両型式ごとに生成されてもよい。この場合、質問推定部13は、質問データに含まれている車両型式情報が示す車両型式に対応する質問推定器を利用して、質問を推定してもよい。又は、質問推定部13は、当該テキストデータと、質問回答DB17に記憶されている各質問との文字列としての類似度を算出し、類似度が閾値以上の質問の中で、類似度が最も高い質問を推定結果としてもよい。なお、文字列同士の類似度の算出については公知技術が用いられればよい。
質問の推定に失敗した場合、すなわち、質問を特定できなかった場合(S204でNo)、図5の処理手順は終了する。又は、出力制御情報送信部16が、質問が不明である旨の応答を車載器30に返信してもよい。例えば、テキストデータの内容が、車両20内における単なる会話や、想定外の質問である場合等に、質問の推定に失敗する。
質問の推定に成功した場合、すなわち、質問を特定できた場合(S204でYes)、回答検索部14は、特定した質問(以下、「対象質問」という。)に対応する回答及び機能名を質問回答DB17から検索する(S205)。
図6は、第1の実施の形態における質問回答DB17の構成例を示す図である。図6に示されるように、質問回答DB17には、車両型式ごとに質問回答テーブルT1a、T1b及びT1c等(以下、それぞれを区別しない場合「質問回答テーブルT1」という。)が記憶されている。なお、図6には3つの質問回答テーブルT1が示されているが、質問回答テーブルT1の数は、車両型式の数に応じて増減されてよい。
各質問回答テーブルT1には、質問に対応付けて、機能名及び回答が記憶されている。機能名は、質問に対する回答に関連する機能の名称である。回答は、質問に対する回答である。
したがって、ステップS205では、質問データに含まれる車両型式情報が示す車両型式に対応する質問回答テーブルT1から、対象質問に対応する回答(以下「対象回答」という。)及び機能名(以下、「対象機能名」という。)が検索(取得)される。
なお、各質問回答テーブルT1に登録される質問は、車両20のパーツや箇所等、車両20のいずれかの位置に関する質問に限定されてもよい。この場合、ステップS203では、テキストデータについて、車両20のいずれかの位置に関する質問が推定されるため、ステップS205以降は、対象質問が車両20のいずれかの位置に関する質問である場合に実行される。
続いて、出力制御情報取得部15は、対象機能名に対応する出力制御情報を出力制御DB18から取得する(S206)。
図7は、第1の実施の形態における出力制御DB18の構成例を示す図である。図7に示されるように、出力制御DB18には、車両型式ごとに出力制御テーブルT2a、T2b及びT2c等(以下、それぞれを区別しない場合「出力制御テーブルT2」という。)が記憶されている。なお、図7では3つの出力制御テーブルT2が示されているが、出力制御テーブルT2の数は、車両型式の数に応じて増減されてよい。
各出力制御テーブルT2には、機能名に対応付けて、音声制御情報及び表示制御情報が記憶されている。音声制御情報は、当該機能名に係る機能の位置(車両20内の位置)に音声を定位させるためのスピーカ60からの音声の出力の制御の内容を示す情報である。表示制御情報は、例えば、テキストや画像等によって当該機能名に関する機能等を示す情報であってもよい。なお、図7では、車両20に搭載されているスピーカ60が2つである場合を前提とし、左右それぞれのスピーカ60からの音量の比が音声制御情報として示されているが、立体音響を実現するための情報であれば、他の形式の情報が音声制御情報として用いられてもよい。例えば、車両20内の特定の位置を示す座標値が音声制御情報とされてもよいし、車両20内を複数の領域に分割した場合のいずれかの領域を示す情報が音声制御情報とされてもよい。
したがって、ステップS206では、質問データに含まれる車両型式情報が示す車両型式に対応する出力制御テーブルT2から、対象機能名に対応する音声制御情報及び表示制御情報が取得される。
なお、本実施の形態では、スピーカ60の種類、数及び配置位置等(以下、「スピーカ構成」という。)が、車両型式に応じて異なる場合について説明するが、車両型式と異なる区分によってスピーカ構成が異なる場合には、当該区分ごとに出力制御テーブルT2が用意されればよい。この場合、当該区分を含む情報が質問データに含まれればよい。
続いて、出力制御情報送信部16は、対象回答、並びにステップS206において取得された音声制御情報及び表示制御情報を、質問データの送信元の車載器30へ送信する(S207)。なお、出力制御情報送信部16は、音声制御情報に従った内容で対象回答がスピーカ60から出力される音声データを生成し、当該音声データを音声制御情報の代わりに車載器30へ送信してもよい。
図4のステップS105では、このような音声制御情報又は音声データに基づいて、対象回答を示す音声について複数のスピーカ60を用いた立体音響での出力が行われる。その結果、当該音声は、対象回答に関連する位置に定位される。
図8は、回答に関連する位置に音声が定位される例を示す図である。図8では、グローブボックスb1の下辺りに対象回答の音声が定位された例が示されている。この場合、ユーザは、「ETCカードはグローブボックスの下です」という回答を示す音声の出力方向を、グローブボックスb1の下辺りの方向に認識する。その結果、ユーザは、当該回答に関連する位置を直感的に把握することができる。
上述したように、第1の実施の形態によれば、質問に対する回答の音声が、立体音響によって当該回答に関連する機能の位置に定位される。したがって、ユーザに対して、当該位置を直感的に伝えることができる。その結果、車両20内での質問に対する回答に関連する位置を把握しやすくすることができる。
次に、第2の実施の形態について説明する。第2の実施の形態では第1の実施の形態と異なる点について説明する。したがって、特に言及されない点については、第1の実施の形態と同様でもよい。
第2の実施の形態では、出力制御DB18の構成が第1の実施の形態と異なる。図9は、第2の実施の形態における出力制御DB18の構成例を示す図である。
図9において、各出力制御テーブルT2は、更に、インジケータ点灯コマンドIDを機能名に対応付けて記憶する。インジケータ点灯コマンドIDは、車両20内の特定のインジケータの点灯命令に対する識別情報であり、点灯対象又は点灯方法は、インジケータ点灯コマンドIDごとに異なる。
したがって、図5のステップS206において、出力制御情報取得部15は、更に、質問データに含まれている車両型式情報が示す車両型式に対応する出力制御テーブルT2から、対象機能名に対応するインジケータ点灯コマンドIDを更に取得する。
ステップS207において、送信部は、新に当該インジケータ点灯コマンドIDを送信する。
図4のステップS106において、表示制御部34は、サーバ装置10から受信されたインジケータ点灯コマンドIDに従って、インジケータ(例えば、LEDランプ等)を点灯させる。その結果、回答に対応する位置のインジケータが点灯する。
上述したように、第2の実施の形態によれば、回答に関連する位置のインジケータが点灯する。その結果、視覚的に当該位置をユーザに把握させることができる。
なお、第2の実施の形態では、スピーカ60から音声が出力されない形態が採用されてよい。この場合、出力制御DB18には、音声制御情報が記憶されていなくてもよい。
なお、上記各実施の形態において、サーバ装置10は、質問応答装置の一例である。但し、上記各実施の形態においてサーバ装置10が有する機能を、車両20(車載器30)が有するようにしてもよい。この場合、車載器30が質問応答装置の一例となる。質問データ受信部11は、受付部の一例である。音声認識部12は、生成部の一例である。回答検索部14は、第1の取得部の一例である。出力制御情報取得部15は、第2の取得部の一例である。出力制御情報送信部16は、出力部の一例である。
以上、本発明の実施の形態について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
10 サーバ装置
11 質問データ受信部
12 音声認識部
13 質問推定部
14 回答検索部
15 出力制御情報取得部
16 出力制御情報送信部
17 質問回答DB
18 出力制御DB
20 車両
30 車載器
31 質問データ送信部
32 出力制御情報受信部
33 音声制御部
34 表示制御部
40 マイク
50 表示装置
60 スピーカ
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
B バス

Claims (5)

  1. 車両内において発声される音声を受け付ける受付部と、
    音声認識に基づいて前記音声が示す文字列を生成する生成部と、
    前記文字列が示す質問に対する回答を取得する第1の取得部と、
    前記回答の音声を前記車両内において当該回答に関連する位置に定位させるための制御情報を取得する第2の取得部と、
    前記制御情報に基づいて、前記回答の音声について前記車両内における複数のスピーカを用いた立体音響での出力を制御する出力制御部と、
    を有することを特徴とする質問応答装置。
  2. 前記第2の取得部は、前記質問が車両のいずれかの位置に関する質問である場合に、前記制御情報を取得する、
    ことを特徴とする請求項1記載の質問応答装置。
  3. 記回答に関連する位置に対応するインジケータ灯す表示制御部
    を有することを特徴とする請求項1又は2記載の質問応答装置。
  4. 車両内において発声される音声を受け付ける受付手順と、
    音声認識に基づいて前記音声が示す文字列を生成する生成手順と、
    前記文字列が示す質問に対する回答を取得する第1の取得手順と、
    前記回答の音声を前記車両内において当該回答に関連する位置に定位させるための制御情報を取得する第2の取得手順と、
    前記制御情報に基づいて、前記回答の音声について前記車両内における複数のスピーカを用いた立体音響での出力を制御する出力制御手順と、
    をコンピュータが実行することを特徴とする質問応答方法。
  5. 車両内において発声される音声を受け付ける受付手順と、
    音声認識に基づいて前記音声が示す文字列を生成する生成手順と、
    前記文字列が示す質問に対する回答を取得する第1の取得手順と、
    前記回答の音声を前記車両内において当該回答に関連する位置に定位させるための制御情報を取得する第2の取得手順と、
    前記制御情報に基づいて、前記回答の音声について前記車両内における複数のスピーカを用いた立体音響での出力を制御する出力制御手順と、
    をコンピュータに実行させることを特徴とするプログラム。
JP2018221944A 2018-11-28 2018-11-28 質問応答装置、質問応答方法及びプログラム Active JP7044040B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018221944A JP7044040B2 (ja) 2018-11-28 2018-11-28 質問応答装置、質問応答方法及びプログラム
US16/582,214 US11455338B2 (en) 2018-11-28 2019-09-25 Question answering device, question answering method, and program
CN201911134749.4A CN111243581A (zh) 2018-11-28 2019-11-19 问答装置、问答方法以及程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018221944A JP7044040B2 (ja) 2018-11-28 2018-11-28 質問応答装置、質問応答方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2020086203A JP2020086203A (ja) 2020-06-04
JP7044040B2 true JP7044040B2 (ja) 2022-03-30

Family

ID=70769949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018221944A Active JP7044040B2 (ja) 2018-11-28 2018-11-28 質問応答装置、質問応答方法及びプログラム

Country Status (3)

Country Link
US (1) US11455338B2 (ja)
JP (1) JP7044040B2 (ja)
CN (1) CN111243581A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112307072A (zh) * 2019-07-26 2021-02-02 沃尔沃汽车公司 车用智能使用手册系统
US11710480B2 (en) * 2019-08-07 2023-07-25 International Business Machines Corporation Phonetic comparison for virtual assistants
JP7338493B2 (ja) 2020-01-29 2023-09-05 トヨタ自動車株式会社 エージェント装置、エージェントシステム及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007194926A (ja) 2006-01-19 2007-08-02 Oki Electric Ind Co Ltd 音声応答システム
JP2010055362A (ja) 2008-08-28 2010-03-11 Toyota Motor Corp 車両用報知装置
JP2015052749A (ja) 2013-09-09 2015-03-19 株式会社デンソー 音声認識システム

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7187947B1 (en) * 2000-03-28 2007-03-06 Affinity Labs, Llc System and method for communicating selected information to an electronic device
JP2006510069A (ja) * 2002-12-11 2006-03-23 ソフトマックス,インク 改良型独立成分分析を使用する音声処理ためのシステムおよび方法
US20040267534A1 (en) * 2003-06-27 2004-12-30 General Motors Corporation Selective vehicle component control
JP2006107148A (ja) 2004-10-06 2006-04-20 Hitachi Ltd 音声情報提供装置
JP2008151766A (ja) 2006-11-22 2008-07-03 Matsushita Electric Ind Co Ltd 立体音響制御装置及び立体音響制御方法
US20080118074A1 (en) 2006-11-22 2008-05-22 Shuichi Takada Stereophonic sound control apparatus and stereophonic sound control method
US9037468B2 (en) * 2008-10-27 2015-05-19 Sony Computer Entertainment Inc. Sound localization for user in motion
US8190438B1 (en) * 2009-10-14 2012-05-29 Google Inc. Targeted audio in multi-dimensional space
US8812065B2 (en) * 2010-06-07 2014-08-19 Ford Global Technologies, Llc System and method for monitoring the location of a communication device in a vehicle based on signal strength
CN104321622B (zh) * 2012-06-05 2017-09-08 苹果公司 情景感知语音引导
JP2014011509A (ja) 2012-06-27 2014-01-20 Sharp Corp 音声出力制御装置、音声出力制御方法、プログラム及び記録媒体
JP6281202B2 (ja) 2013-07-30 2018-02-21 株式会社デンソー 応答制御システム、およびセンター
US10198696B2 (en) * 2014-02-04 2019-02-05 GM Global Technology Operations LLC Apparatus and methods for converting user input accurately to a particular system function
US9762199B2 (en) * 2014-03-31 2017-09-12 Bitwave Pte Ltd. Facilitation of headphone audio enhancement
US9999835B2 (en) * 2015-02-05 2018-06-19 Sony Interactive Entertainment Inc. Motion sickness monitoring and application of supplemental sound to counteract sickness
US9788118B2 (en) * 2015-03-27 2017-10-10 Thales Avionics, Inc. Spatial systems including eye tracking capabilities and related methods
US10008201B2 (en) * 2015-09-28 2018-06-26 GM Global Technology Operations LLC Streamlined navigational speech recognition
US10368162B2 (en) * 2015-10-30 2019-07-30 Google Llc Method and apparatus for recreating directional cues in beamformed audio
US20180190282A1 (en) * 2016-12-30 2018-07-05 Qualcomm Incorporated In-vehicle voice command control
US10045157B2 (en) * 2017-01-05 2018-08-07 International Business Machines Corporation Targeting notifications intended for drivers to a trusted automobile passenger
US10708268B2 (en) * 2017-07-31 2020-07-07 Airwatch, Llc Managing voice applications within a digital workspace
US10224033B1 (en) * 2017-09-05 2019-03-05 Motorola Solutions, Inc. Associating a user voice query with head direction
US10496360B2 (en) * 2018-03-07 2019-12-03 Philip Scott Lyren Emoji to select how or where sound will localize to a listener
US10885727B2 (en) * 2018-05-22 2021-01-05 International Business Machines Corporation Vehicular implemented inspection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007194926A (ja) 2006-01-19 2007-08-02 Oki Electric Ind Co Ltd 音声応答システム
JP2010055362A (ja) 2008-08-28 2010-03-11 Toyota Motor Corp 車両用報知装置
JP2015052749A (ja) 2013-09-09 2015-03-19 株式会社デンソー 音声認識システム

Also Published As

Publication number Publication date
US20200167390A1 (en) 2020-05-28
JP2020086203A (ja) 2020-06-04
US11455338B2 (en) 2022-09-27
CN111243581A (zh) 2020-06-05

Similar Documents

Publication Publication Date Title
KR102388992B1 (ko) 단일 음향 모델 및 자동 악센트 검출로 텍스트 규칙 기반 멀티-악센트 음성 인식
US10991374B2 (en) Request-response procedure based voice control method, voice control device and computer readable storage medium
CN105957522B (zh) 基于语音配置文件的车载信息娱乐身份识别
US20190147849A1 (en) Natural language generation based on user speech style
US9601111B2 (en) Methods and systems for adapting speech systems
CN106816149A (zh) 车辆自动语音识别系统的优先化内容加载
JP7044040B2 (ja) 質問応答装置、質問応答方法及びプログラム
CN112242141B (zh) 一种语音控制方法、智能座舱、服务器、车辆和介质
US9502030B2 (en) Methods and systems for adapting a speech system
KR20200057516A (ko) 음성명령 처리 시스템 및 방법
CN102693725A (zh) 依赖于文本信息语境的语音识别
US20140316782A1 (en) Methods and systems for managing dialog of speech systems
JP2018040904A (ja) 音声認識装置および音声認識方法
CN110035339B (zh) 对话装置
JP6281202B2 (ja) 応答制御システム、およびセンター
US20200286479A1 (en) Agent device, method for controlling agent device, and storage medium
JP2021117941A (ja) エージェント装置、エージェントシステム及びプログラム
JP6481643B2 (ja) 音声処理システムおよび音声処理方法
CN110737422B (zh) 一种声音信号采集方法及装置
US20230298581A1 (en) Dialogue management method, user terminal and computer-readable recording medium
CN113160824B (zh) 信息处理系统
CN110890089A (zh) 语音识别方法及装置
CN108806682B (zh) 获取天气信息的方法和装置
CN116168704B (zh) 语音交互的引导方法、装置、设备、介质及车辆
JP2019212168A (ja) 音声認識システムおよび情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220228

R151 Written notification of patent or utility model registration

Ref document number: 7044040

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151