特許
J-GLOBAL ID:201803018952899599

個別化されたホットワード検出モデル

発明者:
出願人/特許権者:
代理人 (3件): 村山 靖彦 ,  実広 信哉 ,  阿部 達彦
公報種別:公開公報
出願番号(国際出願番号):特願2018-061958
公開番号(公開出願番号):特開2018-109789
出願日: 2018年03月28日
公開日(公表日): 2018年07月12日
要約:
【課題】システム内で通知を提示するための、コンピュータ記憶媒体上に符号化されたコンピュータプログラムを備える、方法、システム、および装置。【解決手段】一態様では、方法は、ユーザによって話される登録発話を表す登録音響データを取得するアクションと、他のユーザによって話される発話を表す候補音響データのセットを取得するアクションと、候補音響データのセットの各候補音響データについて、登録音響データと候補音響データとの間の類似性を表す類似度スコアを決定するアクションと、少なくとも類似度スコアに基づき候補音響データのセットから候補音響データのサブセットを選択するアクションと、候補音響データのサブセットに基づき検出モデルを生成するアクションと、ユーザによって話される発話を検出する際に使用するための検出モデルを提供するアクションとを含む。【選択図】図1
請求項(抜粋):
コンピュータ実装方法であって、 登録プロセス中に、特定のホットワードを話すようユーザに対してクライアントデバイスによって促し、前記ユーザによる前記特定のホットワードの単一の発話に対応するオーディオデータを前記クライアントデバイスによって受け取るステップと、 前記登録プロセス中の前記ユーザによる前記特定のホットワードの単一の発話に対応する前記オーディオデータを受け取ったことに応答して、個別化されたホットワード検出モデルを前記クライアントデバイスによって取得するステップであって、前記個別化されたホットワード検出モデルは、(i)前記登録プロセス中の前記ユーザによる前記特定のホットワードの前記単一の発話に対応する前記オーディオデータと、(ii)他の発話に対応する他の記憶されたオーディオデータであって、該他の記憶されたオーディオデータは、(i)同一の特定のホットワード、および、(ii)前記登録プロセス中に話された前記ユーザによる前記特定のホットワードの前記単一の発話に音響的に類似していると示されるものの両方である、前記他の記憶されたオーディオデータとを使用して、前記ユーザによる前記特定のホットワードのあり得る発話を検出するように学習される、ステップと、 (i)前記ユーザによる前記特定のホットワードの前記単一の発話に対応する前記オーディオデータと、(ii)前記他の発話に対応する前記他の記憶されたオーディオデータであって、該他の記憶されたオーディオデータは、(i)前記同一の特定のホットワード、および、(ii)前記登録プロセス中に話された前記ユーザによる前記特定のホットワードの前記単一の発話に音響的に類似していると示されるものの両方である、前記他の記憶されたオーディオデータとを使用して、前記ユーザが前記特定のホットワードをいつ話すかを検出するように学習される前記個別化されたホットワード検出モデルを取得した後、前記個別化されたホットワード検出モデルを使用して、その後受け取ったオーディオデータ内の前記ユーザによる前記特定のホットワードの前記あり得る発話を前記クライアントデバイスによって検出するステップと を含む、方法。
IPC (3件):
G10L 15/06 ,  G10L 15/10 ,  G10L 15/28
FI (6件):
G10L15/06 300C ,  G10L15/06 300Y ,  G10L15/10 200W ,  G10L15/28 230K ,  G10L15/10 300Z ,  G10L15/10 500T
引用特許:
出願人引用 (1件) 審査官引用 (1件)

前のページに戻る