特許
J-GLOBAL ID:200903029397747941

不特定話者連続音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-247835
公開番号(公開出願番号):特開平7-104780
出願日: 1993年10月04日
公開日(公表日): 1995年04月21日
要約:
【要約】【目的】 従来例に比較して計算量を軽減することができ、しかも音声認識率を大幅に改善することができる不特定話者連続音声認識方法を提供する。【構成】 複数m人の話者に対応して複数m個の発声内容の仮説が存在し、その後各仮説は話者毎にそれぞれ時間経過につれて成長させた音素解析木を用いて、入力された1人の話者の発声内容に基づいて発声内容と話者の2方向を同時にサーチの対象としてビームサーチしながら音声認識を連続的に実行し、音声認識動作中に計算された尤度が所定のしきい値以上のときはこれ以降の尤度計算を行い認識候補として残す一方、それ以外のときは、尤度がしきい値未満となった枝に接続される1つ又は複数の枝を枝刈りしてこれ以降認識候補として残さないで尤度の計算を行わず、音素解析木の終端部において最大の尤度又は所定値以上の尤度を有する発声内容と話者とを同時に音声認識結果として決定する。
請求項(抜粋):
不特定話者の音声を連続的に認識する不特定話者連続音声認識方法であって、複数m人の話者に対応して複数m個の発声内容の仮説が存在し、その後各仮説は話者毎にそれぞれ時間経過につれて成長させた音素解析木を用いて、入力された1人の話者の発声内容に基づいて発声内容と話者の2方向を同時にサーチの対象としてビームサーチしながら音声認識を連続的に実行し、上記音声認識動作中に計算された尤度が所定のしきい値以上のときはこれ以降の尤度計算を行い認識候補として残す一方、所定のしきい値未満となったときは、尤度がしきい値未満となった枝に接続される1つ又は複数の枝を枝刈りしてこれ以降認識候補として残さないで尤度の計算を行わず、上記音素解析木の終端部において最大の尤度又は所定値以上の尤度を有する発声内容と話者とを同時に音声認識結果として決定することを特徴とする不特定話者連続音声認識方法。
IPC (3件):
G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 561
引用特許:
審査官引用 (2件)
  • 特開平4-324499
  • 特開平2-300798

前のページに戻る