JP7314238B2 - 共有された音声対応デバイスにおける電話の処理 - Google Patents
共有された音声対応デバイスにおける電話の処理 Download PDFInfo
- Publication number
- JP7314238B2 JP7314238B2 JP2021179423A JP2021179423A JP7314238B2 JP 7314238 B2 JP7314238 B2 JP 7314238B2 JP 2021179423 A JP2021179423 A JP 2021179423A JP 2021179423 A JP2021179423 A JP 2021179423A JP 7314238 B2 JP7314238 B2 JP 7314238B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- call
- utterance
- user
- enabled device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004044 response Effects 0.000 claims description 87
- 238000000034 method Methods 0.000 claims description 85
- 230000015654 memory Effects 0.000 claims description 46
- 238000013518 transcription Methods 0.000 claims description 14
- 230000035897 transcription Effects 0.000 claims description 14
- 230000008569 process Effects 0.000 description 66
- 230000009471 action Effects 0.000 description 63
- 238000004891 communication Methods 0.000 description 34
- 238000010586 diagram Methods 0.000 description 20
- 230000000977 initiatory effect Effects 0.000 description 19
- 230000000007 visual effect Effects 0.000 description 11
- 230000003993 interaction Effects 0.000 description 10
- 230000001413 cellular effect Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010079 rubber tapping Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42008—Systems for anonymous communication between parties, e.g. by use of disposal contact identifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/45—Network directories; Name-to-address mapping
- H04L61/4594—Address books, i.e. directories containing contact information about correspondents
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1069—Session establishment or de-establishment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1096—Supplementary features, e.g. call forwarding or call holding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42025—Calling or Called party identification service
- H04M3/42034—Calling party identification service
- H04M3/42059—Making use of the calling party identifier
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephonic Communication Services (AREA)
Description
本出願は、2017年5月16日に出願した、「HANDLING PERSONAL TELEPHONE CALLS USING VOICE CONTROL」と題した米国特許仮出願第62/506,805号の利益を主張するものであり、この米国特許仮出願は、参照によりその全体が本明細書に組み込まれる。
110 ユーザ
120 発話
125 音声対応デバイス
132 ユーザアカウント情報の第1の組
134 ユーザアカウント情報の第2の組
136 ユーザアカウント情報の第3の組
140 第1の電話番号
142 第2の電話番号
155 受話者
200 プロセス
300 プロセス
500 システム
502 アシスタントサーバ
504 連絡先データベース
506 ボイスサーバ
508 ネットワーク
510 クライアントデバイス
512 通信回線
514 通信回線
516 要求
518 アクションメッセージ
600 プロセス
700 プロセス
800 プロセス
900 コンピューティングデバイス
902 プロセッサ
904 メモリ
906 記憶装置
908 高速インターフェース
910 高速拡張ポート
912 低速インターフェース
914 低速拡張ポート
916 ディスプレイ
920 サーバ
922 ラップトップコンピュータ
924 ラックサーバシステム
950 モバイルコンピューティングデバイス
952 プロセッサ
954 ディスプレイ
956 ディスプレイインターフェース
958 制御インターフェース
960 音声コーデック
962 外部インターフェース
964 メモリ
966 通信インターフェース
968 トランシーバ
970 GPS受信機モジュール
972 拡張インターフェース
974 拡張メモリ
980 セルラー電話
982 スマートフォン
Claims (17)
デジタルアシスタントデバイスに関連付けられた電話元ユーザから発話を受け取るステップであって、前記発話が、前記デジタルアシスタントデバイスが、前記発話によってまた識別された電話先ユーザへの音声電話を開始することを要求する、ステップと、
少なくとも前記発話に基づいて、複数の異なるユーザから前記電話元ユーザを特定するステップと、
前記電話元ユーザを特定することに基づいて、前記電話元ユーザの異なるデバイスに関連付けられたボイス番号が前記電話元ユーザに関連付けられた前記デジタルアシスタントデバイスに利用可能であると判定するステップと、
前記発話によって特定された前記電話先ユーザに基づいて電話すべき受話者ボイス番号を決定するステップと、
前記デジタルアシスタントデバイスに、前記受話者ボイス番号に前記音声電話を開始させるステップであって、前記受話者ボイス番号への前記音声電話が、前記デジタルアシスタントデバイスに関連付けられた前記ボイス番号の代わりに前記音声電話の元の番号として、前記異なるデバイスに関連付けられた前記ボイス番号を示す、ステップと、
前記デジタルアシスタントデバイスが追加の音声電話を開始することを要求する発話を受信するステップと、
前記複数の異なるユーザのいずれによっても話されていないとして追加の発話を分類するステップと、
前記複数の異なるユーザのいずれによっても話されていないとして第2の発話を分類したことに応答して、前記デジタルアシスタントデバイスに、前記複数の異なるユーザのいずれの連絡先エントリにアクセスすることなく前記追加の音声電話を開始させるステップと を備える、方法。
少なくとも前記発話に基づいて、複数の連絡先エントリの中から特定の連絡先エントリを特定するステップと、
前記受話者ボイス番号として、前記特定の連絡先エントリに関連付けられた特定のボイス番号を決定するステップと
を備える、請求項1に記載の方法。
前記発話の文字起こしを生成するステップと、
前記特定の連絡先エントリに関連付けられた名前を含む前記文字起こしを決定するステップと
を備える、請求項2に記載の方法。
アシスタントサーバから、前記発話に含まれる語りが前記電話元ユーザに対応する語りと一致すると判定されたことの指示を取得するステップ
を備える、請求項1に記載の方法。
前記アシスタントサーバによって、前記発話に含まれる語りが前記電話元ユーザに一致すると判定するステップ
を備える、請求項4に記載の方法。
前記デジタルアシスタントデバイスへ、前記受話者ボイス番号および前記受話者ボイス番号に前記音声電話を開始する命令を提供するステップ
を備える、請求項1に記載の方法。
少なくとも1つのプロセッサと、
命令を備えたメモリであって、
1つまたは複数のプロセッサによって実装される方法であって、実行されたとき、前記少なくとも1つのプロセッサに、
デジタルアシスタントデバイスに関連付けられた電話元ユーザから発話を受け取ることであって、前記発話が、前記デジタルアシスタントデバイスが、前記発話によってまた識別された電話先ユーザへの音声電話を開始することを要求する、受け取ることと、
少なくとも前記発話に基づいて、複数の異なるユーザから前記電話元ユーザを特定することと、
前記電話元ユーザを特定することに基づいて、前記電話元ユーザの異なるデバイスに関連付けられたボイス番号が前記電話元ユーザに関連付けられた前記デジタルアシスタントデバイスに利用可能であると判定することと、
前記発話によって特定された前記電話先ユーザに基づいて電話すべき受話者ボイス番号を決定することと、
前記デジタルアシスタントデバイスに、前記受話者ボイス番号に前記音声電話を開始させることであって、前記受話者ボイス番号への前記音声電話が、前記デジタルアシスタントデバイスに関連付けられた前記ボイス番号の代わりに前記音声電話の元の番号として、前記異なるデバイスに関連付けられた前記ボイス番号を示す、開始させることと、
前記デジタルアシスタントデバイスが追加の音声電話を開始することを要求する発話を受信することと、
前記複数の異なるユーザのいずれによっても話されていないとして追加の発話を分類することと、
前記複数の異なるユーザのいずれによっても話されていないとして第2の発話を分類したことに応答して、前記デジタルアシスタントデバイスに、前記複数の異なるユーザのいずれの連絡先エントリにアクセスすることなく前記追加の音声電話を開始させることと
を行わせる命令を備える、メモリと
を備える、システム。
少なくとも前記発話に基づいて、複数の連絡先エントリの中から特定の連絡先エントリを特定することと、
前記受話者ボイス番号として、前記特定の連絡先エントリに関連付けられた特定のボイス番号を決定することと
を行わせるための命令を備える、請求項7に記載のシステム。
前記発話の文字起こしを生成することと、
前記特定の連絡先エントリに関連付けられた名前を含む前記文字起こしを決定することと
を行わせるための命令を備える、請求項8に記載のシステム。
アシスタントサーバから、前記発話に含まれる語りが前記電話元ユーザに対応する語りと一致すると判定されたことの指示を取得すること
を行わせるための命令を備える、請求項7に記載のシステム。
前記アシスタントサーバによって、前記発話に含まれる語りが前記電話元ユーザに一致すると判定すること
を行わせるための命令を備える、請求項10に記載のシステム。
前記デジタルアシスタントデバイスへ、前記受話者ボイス番号および前記受話者ボイス番号に前記音声電話を開始する命令を提供すること
を行わせるための命令を備える、請求項7に記載のシステム。
デジタルアシスタントデバイスに関連付けられた電話元ユーザから発話を受け取ることであって、前記発話が、前記デジタルアシスタントデバイスが、前記発話によってまた識別された電話先ユーザへの音声電話を開始することを要求する、受け取ることと、
少なくとも前記発話に基づいて、複数の異なるユーザから前記電話元ユーザを特定することと、
前記電話元ユーザを特定することに基づいて、前記電話元ユーザの異なるデバイスに関連付けられたボイス番号が前記電話元ユーザに関連付けられた前記デジタルアシスタントデバイスに利用可能であると判定することと、
前記発話によって特定された前記電話先ユーザに基づいて電話すべき受話者ボイス番号を決定することと、
前記デジタルアシスタントデバイスに、前記受話者ボイス番号に前記音声電話を開始させることであって、前記受話者ボイス番号への前記音声電話が、前記デジタルアシスタントデバイスに関連付けられた前記ボイス番号の代わりに前記音声電話の元の番号として、前記異なるデバイスに関連付けられた前記ボイス番号を示す、開始させることと、
前記デジタルアシスタントデバイスが追加の音声電話を開始することを要求する発話を受信することと、
前記複数の異なるユーザのいずれによっても話されていないとして追加の発話を分類することと、
前記複数の異なるユーザのいずれによっても話されていないとして第2の発話を分類したことに応答して、前記デジタルアシスタントデバイスに、前記複数の異なるユーザのいずれの連絡先エントリにアクセスすることなく前記追加の音声電話を開始させることと
を備える動作を実施させる、非一時的コンピュータ可読記憶媒体。
少なくとも前記発話に基づいて、複数の連絡先エントリの中から特定の連絡先エントリを特定することと、
前記受話者ボイス番号として、前記特定の連絡先エントリに関連付けられた特定のボイス番号を決定することと
を備える、請求項13に記載の非一時的コンピュータ可読記憶媒体。
前記発話の文字起こしを生成することと、
前記特定の連絡先エントリに関連付けられた名前を含む前記文字起こしを決定することと
を備える、請求項14に記載の非一時的コンピュータ可読記憶媒体。
アシスタントサーバによって、前記発話に含まれる語りが前記電話元ユーザに一致すると判定すること
を備える、請求項13に記載の非一時的コンピュータ可読記憶媒体。
前記デジタルアシスタントデバイスへ、前記受話者ボイス番号および前記受話者ボイス番号に前記音声電話を開始する命令を提供すること
を備える、請求項13に記載の非一時的コンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023113934A JP2023138512A (ja) | 2017-05-16 | 2023-07-11 | 共有された音声対応デバイスにおける電話の処理 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762506805P | 2017-05-16 | 2017-05-16 | |
US62/506,805 | 2017-05-16 | ||
JP2019545937A JP6974486B2 (ja) | 2017-05-16 | 2018-05-16 | 共有された音声対応デバイスにおける電話の処理 |
PCT/US2018/032873 WO2018213381A1 (en) | 2017-05-16 | 2018-05-16 | Handling calls on a shared speech-enabled device |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019545937A Division JP6974486B2 (ja) | 2017-05-16 | 2018-05-16 | 共有された音声対応デバイスにおける電話の処理 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023113934A Division JP2023138512A (ja) | 2017-05-16 | 2023-07-11 | 共有された音声対応デバイスにおける電話の処理 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022019745A JP2022019745A (ja) | 2022-01-27 |
JP7314238B2 true JP7314238B2 (ja) | 2023-07-25 |
Family
ID=62567788
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019545937A Active JP6974486B2 (ja) | 2017-05-16 | 2018-05-16 | 共有された音声対応デバイスにおける電話の処理 |
JP2021179423A Active JP7314238B2 (ja) | 2017-05-16 | 2021-11-02 | 共有された音声対応デバイスにおける電話の処理 |
JP2023113934A Pending JP2023138512A (ja) | 2017-05-16 | 2023-07-11 | 共有された音声対応デバイスにおける電話の処理 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019545937A Active JP6974486B2 (ja) | 2017-05-16 | 2018-05-16 | 共有された音声対応デバイスにおける電話の処理 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023113934A Pending JP2023138512A (ja) | 2017-05-16 | 2023-07-11 | 共有された音声対応デバイスにおける電話の処理 |
Country Status (6)
Country | Link |
---|---|
US (8) | US10911594B2 (ja) |
EP (2) | EP3920180A3 (ja) |
JP (3) | JP6974486B2 (ja) |
KR (6) | KR102396729B1 (ja) |
CN (2) | CN110392913B (ja) |
WO (1) | WO2018213381A1 (ja) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9306985B1 (en) * | 2014-03-25 | 2016-04-05 | 8X8, Inc. | User configurable data storage |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10141009B2 (en) | 2016-06-28 | 2018-11-27 | Pindrop Security, Inc. | System and method for cluster-based audio event detection |
WO2018053537A1 (en) | 2016-09-19 | 2018-03-22 | Pindrop Security, Inc. | Improvements of speaker recognition in the call center |
CA3179080A1 (en) | 2016-09-19 | 2018-03-22 | Pindrop Security, Inc. | Channel-compensated low-level features for speaker recognition |
CN110392913B (zh) | 2017-05-16 | 2023-09-29 | 谷歌有限责任公司 | 在共用的启用语音的装置上处理呼叫 |
CN111343060B (zh) | 2017-05-16 | 2022-02-11 | 苹果公司 | 用于家庭媒体控制的方法和界面 |
US9888117B1 (en) * | 2017-06-21 | 2018-02-06 | GetHuman, Inc. | Hold time reducer |
US10911596B1 (en) * | 2017-08-31 | 2021-02-02 | Amazon Technologies, Inc. | Voice user interface for wired communications system |
EP3496090A1 (en) * | 2017-12-07 | 2019-06-12 | Thomson Licensing | Device and method for privacy-preserving vocal interaction |
AU2019267527A1 (en) | 2018-05-07 | 2020-11-19 | Apple Inc. | User interfaces for viewing live video feeds and recorded video |
US11132681B2 (en) | 2018-07-06 | 2021-09-28 | At&T Intellectual Property I, L.P. | Services for entity trust conveyances |
KR102574903B1 (ko) * | 2018-08-08 | 2023-09-05 | 삼성전자주식회사 | 개인화된 장치 연결을 지원하는 전자 장치 및 그 방법 |
US10802872B2 (en) | 2018-09-12 | 2020-10-13 | At&T Intellectual Property I, L.P. | Task delegation and cooperation for automated assistants |
US11481186B2 (en) * | 2018-10-25 | 2022-10-25 | At&T Intellectual Property I, L.P. | Automated assistant context and protocol |
US10958775B2 (en) | 2018-12-10 | 2021-03-23 | Mitel Networks Corporation | Speech to dual-tone multifrequency system and method |
US11830485B2 (en) * | 2018-12-11 | 2023-11-28 | Amazon Technologies, Inc. | Multiple speech processing system with synthesized speech styles |
TR201821135A2 (tr) * | 2018-12-30 | 2019-01-21 | Turkcell Teknoloji Arastirma Ve Gelistirme Anonim Sirketi | Anlik mesajlaşma uygulamalarinda sesli̇ mesajlaşmanin teti̇klenmesi̇ni̇ sağlayan bi̇r si̇stem |
WO2020163624A1 (en) | 2019-02-06 | 2020-08-13 | Pindrop Security, Inc. | Systems and methods of gateway detection in a telephone network |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11003419B2 (en) | 2019-03-19 | 2021-05-11 | Spotify Ab | Refinement of voice query interpretation |
JP7167797B2 (ja) * | 2019-03-22 | 2022-11-09 | 株式会社ナカヨ | 主装置および内線電話機の割り当て方法 |
US11646018B2 (en) | 2019-03-25 | 2023-05-09 | Pindrop Security, Inc. | Detection of calls from voice assistants |
US12015637B2 (en) | 2019-04-08 | 2024-06-18 | Pindrop Security, Inc. | Systems and methods for end-to-end architectures for voice spoofing detection |
WO2020222539A1 (en) | 2019-05-02 | 2020-11-05 | Samsung Electronics Co., Ltd. | Hub device, multi-device system including the hub device and plurality of devices, and method of operating the same |
US10904029B2 (en) | 2019-05-31 | 2021-01-26 | Apple Inc. | User interfaces for managing controllable external devices |
US11924253B2 (en) | 2019-06-04 | 2024-03-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Network node, IMS node and methods in a communications network |
EP3981123A1 (en) | 2019-06-04 | 2022-04-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Network node, ims node and methods in a communications network |
WO2020246923A1 (en) * | 2019-06-04 | 2020-12-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Network node, ims node and methods in a communications network |
WO2020256604A1 (en) * | 2019-06-19 | 2020-12-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Network node, ims node and methods in a communications network |
US11176940B1 (en) * | 2019-09-17 | 2021-11-16 | Amazon Technologies, Inc. | Relaying availability using a virtual assistant |
CN111063343B (zh) * | 2019-12-11 | 2022-08-19 | 广东美的厨房电器制造有限公司 | 语音交互方法、装置、电子设备及介质 |
US11423893B2 (en) * | 2020-01-06 | 2022-08-23 | Lenovo (Singapore) Pte. Ltd. | Response to secondary inputs at a digital personal assistant |
US11240366B2 (en) | 2020-02-03 | 2022-02-01 | Microsoft Technology Licensing, Llc | Digital assistant for emergency calling |
US11513667B2 (en) * | 2020-05-11 | 2022-11-29 | Apple Inc. | User interface for audio message |
US11750668B1 (en) * | 2020-06-23 | 2023-09-05 | Nikolay Abkairov | Combined asynchronous and synchronous communication system and service with transcription support |
US11700226B2 (en) * | 2020-08-03 | 2023-07-11 | Google Llc | Sending messages from smart speakers and smart displays via smartphones |
US11392291B2 (en) | 2020-09-25 | 2022-07-19 | Apple Inc. | Methods and interfaces for media control with dynamic feedback |
US11908473B2 (en) * | 2022-05-10 | 2024-02-20 | Apple Inc. | Task modification after task initiation |
EP4321990A1 (en) * | 2022-08-11 | 2024-02-14 | Koninklijke Philips N.V. | Selectively communicating an audio signal |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003218996A (ja) | 2002-01-18 | 2003-07-31 | Alpine Electronics Inc | 携帯電話のハンズフリー装置 |
JP2017034386A (ja) | 2015-07-30 | 2017-02-09 | 株式会社デンソー | 車載機及びコンピュータプログラム |
Family Cites Families (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4661975A (en) * | 1985-03-13 | 1987-04-28 | Bell Communications Research, Inc. | Enhanced call-waiting service |
US4945570A (en) | 1987-10-02 | 1990-07-31 | Motorola, Inc. | Method for terminating a telephone call by voice command |
US4870686A (en) | 1987-10-19 | 1989-09-26 | Motorola, Inc. | Method for entering digit sequences by voice command |
JPH02312426A (ja) * | 1989-05-29 | 1990-12-27 | Nissan Motor Co Ltd | 車両用電話装置 |
US5165095A (en) * | 1990-09-28 | 1992-11-17 | Texas Instruments Incorporated | Voice telephone dialing |
US5483579A (en) | 1993-02-25 | 1996-01-09 | Digital Acoustics, Inc. | Voice recognition dialing system |
US5483586A (en) | 1994-07-18 | 1996-01-09 | Sussman; Lester | Electronic on-line subscriber telephone directory |
FI111893B (fi) | 1995-06-02 | 2003-09-30 | Nokia Corp | Menetelmä ja laite puhelimen ohjaamiseksi komennoilla |
US6167117A (en) * | 1996-10-07 | 2000-12-26 | Nortel Networks Limited | Voice-dialing system using model of calling behavior |
GB2348566A (en) * | 1999-03-31 | 2000-10-04 | Ibm | Computer network telephony |
DE60033733T2 (de) | 1999-05-31 | 2007-12-06 | Nippon Telegraph And Telephone Corp. | Datenbankabfragesystem basierend auf Spracherkennung |
US7746994B1 (en) | 1999-09-28 | 2010-06-29 | Naxos Finance Sa | Method for managing information in a telephone and telephone for managing information |
DE60026179T2 (de) * | 2000-01-19 | 2006-11-02 | Koninklijke Philips Electronics N.V. | Fm rundfunkempfänger |
US6915262B2 (en) * | 2000-11-30 | 2005-07-05 | Telesector Resources Group, Inc. | Methods and apparatus for performing speech recognition and using speech recognition results |
US6868142B2 (en) | 2001-01-10 | 2005-03-15 | At&T Corp. | Voice-operated interface for DTMF-controlled systems |
US20030103618A1 (en) | 2001-12-03 | 2003-06-05 | International Business Machines Corporation | Voice browsing while waiting in a hold queue |
US20040010408A1 (en) | 2002-07-10 | 2004-01-15 | Mani Babu V. | Method and system for identifying a caller based on voice recognition |
JP3901666B2 (ja) * | 2003-05-26 | 2007-04-04 | シャープ株式会社 | 移動電話機 |
US7852993B2 (en) * | 2003-08-11 | 2010-12-14 | Microsoft Corporation | Speech recognition enhanced caller identification |
US7015049B2 (en) * | 2003-09-03 | 2006-03-21 | Infineon Technologies Ag | Fence-free etching of iridium barrier having a steep taper angle |
US20050154587A1 (en) * | 2003-09-11 | 2005-07-14 | Voice Signal Technologies, Inc. | Voice enabled phone book interface for speaker dependent name recognition and phone number categorization |
US7870184B2 (en) * | 2004-04-05 | 2011-01-11 | Avaya Inc. | Communications services for business process design |
US7826945B2 (en) * | 2005-07-01 | 2010-11-02 | You Zhang | Automobile speech-recognition interface |
WO2007047580A2 (en) * | 2005-10-18 | 2007-04-26 | Page2Cell, Inc. | System and method for providing a public number-private number telephony system |
AU2005338854A1 (en) * | 2005-12-06 | 2007-06-14 | Daniel John Simpson | Interactive natural language calling system |
US20070299670A1 (en) | 2006-06-27 | 2007-12-27 | Sbc Knowledge Ventures, Lp | Biometric and speech recognition system and method |
US7831431B2 (en) | 2006-10-31 | 2010-11-09 | Honda Motor Co., Ltd. | Voice recognition updates via remote broadcast signal |
WO2008116296A1 (en) * | 2007-03-26 | 2008-10-02 | Digifonica (International) Limited | Emergency assistance calling for voice over ip communications systems |
US20080247529A1 (en) * | 2007-04-03 | 2008-10-09 | Microsoft Corporation | Incoming Call Classification And Disposition |
US8131556B2 (en) | 2007-04-03 | 2012-03-06 | Microsoft Corporation | Communications using different modalities |
US8099289B2 (en) * | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
US20110026687A1 (en) * | 2009-07-31 | 2011-02-03 | Vladimir Smelyansky | Emergency 911 services with just-in-time provisioning for voip customers |
US9026444B2 (en) * | 2009-09-16 | 2015-05-05 | At&T Intellectual Property I, L.P. | System and method for personalization of acoustic models for automatic speech recognition |
JP5567914B2 (ja) | 2010-06-25 | 2014-08-06 | 京セラ株式会社 | 携帯端末装置 |
KR101771013B1 (ko) | 2011-06-09 | 2017-08-24 | 삼성전자 주식회사 | 정보 제공 방법 및 이를 구현하는 이동통신단말기 |
US20130148582A1 (en) | 2011-11-17 | 2013-06-13 | Tip Solutions, Inc. | Message injection system and method |
US9529793B1 (en) | 2012-06-01 | 2016-12-27 | Google Inc. | Resolving pronoun ambiguity in voice queries |
US20160063106A1 (en) | 2012-08-08 | 2016-03-03 | Google Inc. | Related Entity Search |
US9224387B1 (en) | 2012-12-04 | 2015-12-29 | Amazon Technologies, Inc. | Targeted detection of regions in speech processing data streams |
EP2784774A1 (en) * | 2013-03-29 | 2014-10-01 | Orange | Telephone voice personnal assistant |
US8903051B2 (en) * | 2013-04-12 | 2014-12-02 | Verizon Patent And Licensing Inc. | Returning calls to emergency callers without valid telephone numbers |
WO2014200731A1 (en) * | 2013-06-13 | 2014-12-18 | Apple Inc. | System and method for emergency calls initiated by voice command |
US10134395B2 (en) | 2013-09-25 | 2018-11-20 | Amazon Technologies, Inc. | In-call virtual assistants |
US8719039B1 (en) * | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
US20170017501A1 (en) * | 2013-12-16 | 2017-01-19 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US10073840B2 (en) * | 2013-12-20 | 2018-09-11 | Microsoft Technology Licensing, Llc | Unsupervised relation detection model training |
US9286910B1 (en) | 2014-03-13 | 2016-03-15 | Amazon Technologies, Inc. | System for resolving ambiguous queries based on user context |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9424841B2 (en) * | 2014-10-09 | 2016-08-23 | Google Inc. | Hotword detection on multiple devices |
US9466297B2 (en) * | 2014-12-09 | 2016-10-11 | Microsoft Technology Licensing, Llc | Communication system |
US9911415B2 (en) * | 2014-12-19 | 2018-03-06 | Lenovo (Singapore) Pte. Ltd. | Executing a voice command during voice input |
US9756181B2 (en) * | 2014-12-31 | 2017-09-05 | Bailey Analytics, Inc | Phone number identification systems and methods |
US9544412B2 (en) | 2015-03-09 | 2017-01-10 | Ford Global Technologies, Llc | Voice profile-based in-vehicle infotainment identity identification |
US9666192B2 (en) * | 2015-05-26 | 2017-05-30 | Nuance Communications, Inc. | Methods and apparatus for reducing latency in speech recognition applications |
US9503577B1 (en) * | 2015-07-10 | 2016-11-22 | Verizon Patent And Licensing Inc. | Emergency call service for groups of devices with a shared number |
WO2017197650A1 (zh) | 2016-05-20 | 2017-11-23 | 华为技术有限公司 | 通话中的交互方法和设备 |
US20170374529A1 (en) * | 2016-06-23 | 2017-12-28 | Diane Walker | Speech Recognition Telecommunications System with Distributable Units |
JP6402748B2 (ja) * | 2016-07-19 | 2018-10-10 | トヨタ自動車株式会社 | 音声対話装置および発話制御方法 |
US10423652B2 (en) * | 2016-08-08 | 2019-09-24 | Baidu Usa Llc | Knowledge graph entity reconciler |
US10187503B2 (en) * | 2016-08-19 | 2019-01-22 | Amazon Technologies, Inc. | Enabling voice control of telephone device |
US10074369B2 (en) * | 2016-09-01 | 2018-09-11 | Amazon Technologies, Inc. | Voice-based communications |
US20180218374A1 (en) * | 2017-01-31 | 2018-08-02 | Moveworks, Inc. | Method, system and computer program product for facilitating query resolutions at a service desk |
CN110392913B (zh) | 2017-05-16 | 2023-09-29 | 谷歌有限责任公司 | 在共用的启用语音的装置上处理呼叫 |
US20180343233A1 (en) | 2017-05-24 | 2018-11-29 | Lenovo (Singapore) Pte. Ltd. | Contextual name association |
US10506088B1 (en) * | 2017-09-25 | 2019-12-10 | Amazon Technologies, Inc. | Phone number verification |
WO2019070351A1 (en) | 2017-10-03 | 2019-04-11 | Fanmountain Llc | SYSTEMS, DEVICES AND METHODS USING THE SAME TO ENHANCE THE COMMITMENT OF A PUBLIC IN COMPETITION OR PERFORMANCE |
US10984799B2 (en) * | 2018-03-23 | 2021-04-20 | Amazon Technologies, Inc. | Hybrid speech interface device |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11258746B1 (en) | 2019-04-18 | 2022-02-22 | Amazon Technologies, Inc. | Setting overrides |
-
2018
- 2018-05-16 CN CN201880016425.8A patent/CN110392913B/zh active Active
- 2018-05-16 WO PCT/US2018/032873 patent/WO2018213381A1/en active Search and Examination
- 2018-05-16 CN CN202311189336.2A patent/CN117238296A/zh active Pending
- 2018-05-16 US US15/980,836 patent/US10911594B2/en active Active
- 2018-05-16 KR KR1020217029035A patent/KR102396729B1/ko active IP Right Grant
- 2018-05-16 US US15/980,822 patent/US11057515B2/en active Active
- 2018-05-16 EP EP21177634.9A patent/EP3920180A3/en active Pending
- 2018-05-16 KR KR1020197024069A patent/KR102223017B1/ko active IP Right Grant
- 2018-05-16 JP JP2019545937A patent/JP6974486B2/ja active Active
- 2018-05-16 EP EP18730530.5A patent/EP3577646B1/en active Active
- 2018-05-16 KR KR1020237032094A patent/KR20230136707A/ko not_active Application Discontinuation
- 2018-05-16 US US15/980,805 patent/US10791215B2/en active Active
- 2018-05-16 KR KR1020227036462A patent/KR102582517B1/ko active IP Right Grant
- 2018-05-16 KR KR1020217005692A patent/KR102303810B1/ko active IP Right Grant
- 2018-05-16 KR KR1020227015203A patent/KR102458806B1/ko active IP Right Grant
-
2020
- 2020-09-28 US US17/034,635 patent/US11089151B2/en active Active
- 2020-12-10 US US17/118,387 patent/US11595514B2/en active Active
-
2021
- 2021-08-04 US US17/393,536 patent/US11622038B2/en active Active
- 2021-11-02 JP JP2021179423A patent/JP7314238B2/ja active Active
-
2023
- 2023-02-28 US US18/115,441 patent/US11979518B2/en active Active
- 2023-07-11 JP JP2023113934A patent/JP2023138512A/ja active Pending
-
2024
- 2024-03-26 US US18/617,042 patent/US20240244133A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003218996A (ja) | 2002-01-18 | 2003-07-31 | Alpine Electronics Inc | 携帯電話のハンズフリー装置 |
JP2017034386A (ja) | 2015-07-30 | 2017-02-09 | 株式会社デンソー | 車載機及びコンピュータプログラム |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7314238B2 (ja) | 共有された音声対応デバイスにおける電話の処理 | |
US11388291B2 (en) | System and method for processing voicemail | |
US8892442B2 (en) | System and method for answering a communication notification | |
US8537980B2 (en) | Conversation support | |
US12095945B2 (en) | Indicating callers for incoming voice calls on a shared speech-enabled device | |
CN110915246A (zh) | 将语音支持设备与显示设备配对 | |
US20140315520A1 (en) | Recording and playing back portions of a telephone call |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211201 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230612 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230712 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7314238 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |