特許
J-GLOBAL ID:201803020817359848
自然言語バーチャルアシスタントでの全二重発話処理
発明者:
,
,
出願人/特許権者:
代理人 (1件):
特許業務法人深見特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2017-230590
公開番号(公開出願番号):特開2018-106702
出願日: 2017年11月30日
公開日(公表日): 2018年07月05日
要約:
【課題】クエリ処理システムは、ユーザによって話された一連のクエリを表現する入力オーディオストリームを処理する。【解決手段】クエリ処理システムは、入力オーディオストリームを連続的にリスニングし、クエリを解析し、ストリーム中に適切な動作を行なう。いくつかの実施形態においては、システムは、直列の制約によって制限される、クエリの並列な処理を実行する。いくつかの実施形態においては、システムは、先行のクエリの実行が依然として進行中である間、クエリを解析して実行する。ゆっくりと話し、思考を別個の部分に分けて表現する傾向があるユーザに対応するために、クエリ処理システムは、新しいスピーチ発話が先行のクエリの意味を変えてしまうことを検出した場合、先行のクエリに対応する結果の出力を停止する。【選択図】図1
請求項(抜粋):
口語入力に対する応答を生成する、コンピュータによって実現される方法であって、前記方法は、
オーディオ入力ストリームを取得するステップと、
前記オーディオ入力ストリームにおいて第1の発話の始まりを検出するステップと、
前記オーディオ入力ストリームにおいて前記第1発話の終わりを検出するステップと、
前記第1の発話の前記終わりを検出したことに応じて、第1のクエリを認識するために前記第1の発話の処理を開始するステップと、
前記第1の発話を処理している間、
前記オーディオ入力ストリームを受取り続けるステップと、
前記オーディオ入力ストリームにおいて第2の発話の始まりを検出するステップとを含む、コンピュータによって実現される方法。
IPC (2件):
FI (4件):
G06F17/30 330C
, G06F17/30 310Z
, G06F3/16 650
, G06F3/16 690
引用特許: