自然言語バーチャルアシスタントでの全二重発話処理

発明者： , ,
出願人/特許権者：
代理人 (1件)：特許業務法人深見特許事務所
公報種別：公開公報
出願番号（国際出願番号）：特願2017-230590
公開番号（公開出願番号）：特開2018-106702
出願日： 2017年11月30日
公開日（公表日）： 2018年07月05日
要約：

【課題】クエリ処理システムは、ユーザによって話された一連のクエリを表現する入力オーディオストリームを処理する。【解決手段】クエリ処理システムは、入力オーディオストリームを連続的にリスニングし、クエリを解析し、ストリーム中に適切な動作を行なう。いくつかの実施形態においては、システムは、直列の制約によって制限される、クエリの並列な処理を実行する。いくつかの実施形態においては、システムは、先行のクエリの実行が依然として進行中である間、クエリを解析して実行する。ゆっくりと話し、思考を別個の部分に分けて表現する傾向があるユーザに対応するために、クエリ処理システムは、新しいスピーチ発話が先行のクエリの意味を変えてしまうことを検出した場合、先行のクエリに対応する結果の出力を停止する。【選択図】図1

請求項（抜粋）：

口語入力に対する応答を生成する、コンピュータによって実現される方法であって、前記方法は、オーディオ入力ストリームを取得するステップと、前記オーディオ入力ストリームにおいて第1の発話の始まりを検出するステップと、前記オーディオ入力ストリームにおいて前記第1発話の終わりを検出するステップと、前記第1の発話の前記終わりを検出したことに応じて、第1のクエリを認識するために前記第1の発話の処理を開始するステップと、前記第1の発話を処理している間、前記オーディオ入力ストリームを受取り続けるステップと、前記オーディオ入力ストリームにおいて第2の発話の始まりを検出するステップとを含む、コンピュータによって実現される方法。

IPC (2件)：

G06F 17/30 , G06F 3/16

FI (4件)：

G06F17/30 330C , G06F17/30 310Z , G06F3/16 650 , G06F3/16 690

引用特許：

審査官引用 (4件)

コンテンツ検索装置、コンテンツ検索方法及び制御プログラム
公報種別：公開公報出願番号：特願2012-263583 出願人：株式会社東芝
音声ユーザ・インターフェースを介したデータベース照会結果の提示方法およびシステム
公報種別：公開公報出願番号：特願2002-019980 出願人：インターナショナル・ビジネス・マシーンズ・コーポレーション
データベース検索プログラム、データベース検索方法及びデータベース検索装置
公報種別：公開公報出願番号：特願2002-263396 出願人：日立ソフトウエアエンジニアリング株式会社

全件表示

前のページに戻る