特許
J-GLOBAL ID:201903009722152212

ワード検出システム、ワード検出方法及びワード検出プログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人スズエ国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2018-170090
公開番号(公開出願番号):特開2019-144524
出願日: 2018年09月11日
公開日(公表日): 2019年08月29日
要約:
【課題】音声データからキーとなるワードを正確にかつ素早く検出する。【解決手段】一実施形態に係るワード検出システムは、複数のフレームを含む音声データを取得して音声特徴量を生成し、ターゲットとなるワードに対応付けられた音声特徴量に基づく参照モデルを音声データの複数のフレームそれぞれとマッチングしてフレームスコアを算出し、そのフレームスコアからワードの第1スコアを算出し、ワードのフレームスコアを保持し、第1スコアに基づいて音声データからワードを検出し、検出したワードの始端、終端の時間情報を出力し、検出したワードの始端、終端の時間情報と保持されているフレームスコアに基づいて、ワードに対する第2スコアを算出し、第2スコアの値を用いて複数のワードに対する第2スコアまたは予め決められた閾値スコアまたはその両方と比較し、その比較結果に基づいて出力対象とするワードを決定する。【選択図】 図3
請求項(抜粋):
複数のフレームを含む音声データを取得して音声特徴量を生成する音声取得部と、 ターゲットとなるワードに対応付けられた前記音声特徴量に基づく参照モデルを前記音声データの複数のフレームそれぞれとマッチングすることによってフレームスコアを算出し、そのフレームスコアから前記ワードの第1スコアを算出する第1算出部と、 前記ワードのフレームスコアを保持する保持部と、 前記第1スコアに基づいて前記音声データから前記ワードを検出し、検出したワードの始端、終端の時間情報を出力する検出部と、 前記検出したワードの始端、終端の時間情報と前記保持部に保持されているフレームスコアに基づいて、前記ワードに対する第2スコアを算出する第2算出部と、 前記第2スコアの値を用いて複数のワードに対する第2スコアまたは予め決められた閾値スコアまたはその両方と比較し、その比較結果に基づいて出力対象とするワードを決定する出力部と を具備するワード検出システム。
IPC (4件):
G10L 15/10 ,  G06F 16/00 ,  G06F 16/60 ,  G10L 15/04
FI (5件):
G10L15/10 200W ,  G06F17/30 210A ,  G06F17/30 170E ,  G10L15/10 300Z ,  G10L15/04 300C
引用特許:
出願人引用 (2件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平5-051897   出願人:松下電器産業株式会社
  • 連続音声認識方式
    公報種別:公開公報   出願番号:特願平9-201685   出願人:日本電気株式会社

前のページに戻る