特許
J-GLOBAL ID:200903026181136906
音声認識システムと方法およびそのプログラムを記録した記録媒体
発明者:
,
,
出願人/特許権者:
代理人 (1件):
磯村 雅俊 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-005431
公開番号(公開出願番号):特開平11-202895
出願日: 1998年01月14日
公開日(公表日): 1999年07月30日
要約:
【要約】【課題】 音節毎に区切るようなゆっくりとした発声に対応できないといった、認識対象による発声の制約がある。【解決手段】 結果判定部5から照合部4へのフィードバックパスを設け、照合部4において、結果判定部5からフィードバックされる判定結果に基づき暫定的な候補をある時間蓄えておき、単語あるいは文の途中から照合処理を継続する。これにより、例えば、単語音声認識において、単語単位の標準パターンは変更しなくとも、照合の内部データを一部保持することにより、従来全く認識不可能であった音節単位で区切って発声される単語音声、すなわち、ポーズで分割された音節単位発声の単語音声もある程度正しく認識でき、また、一息では言いづらい長い単語の音声認識が可能となる。
請求項(抜粋):
音声をA/D変換して取り込む音声入力手段と、該音声入力手段で取り込んだ音声を所定の間隔(フレーム)毎に音響分析して特徴ベクトルの時系列パターンを求める音声分析手段と、該音声分析手段で求めた上記特徴ベクトルの時系列パターンから、音声の始端および終端を検出して音声区間を判定する音声区間検出手段と、該音声区間検出手段で判定した音声区間の上記特徴ベクトルの時系列パターンに対して、予め作成された複数の標準パターンとのそれぞれの尤度を取得する照合手段と、該照合手段で取得した尤度に基づき、上記音声入力手段で取り込んだ音声に対応する上記標準パターンおよび該標準パターンに予め対応付けられた言語情報を判定する判定手段と、該判定手段で判定した言語情報を出力する出力手段とからなる音声認識システムであって、先頭から末尾を含む任意の位置までの部分(先頭部分)が上記判定手段で上記音声に対応すると判定された上記標準パターンを抽出して上記照合手段に渡すフィードバック手段を設け、上記照合手段は、上記音声区間のそれぞれで、上記先頭部分での尤度と共に、上記フィードバック手段から渡された標準パターンの上記先頭部分の後からの部分(途中部分)での尤度を求め、上記判定手段は、上記途中部分での尤度を優先して、上記音声に対応する標準パターンを判定し、上記途中部分での尤度を優先して判定された標準パターンを、上記フィードバック手段を介して上記照合手段に渡し、上記照合手段と上記判定手段および上記フィードバック手段による処理を複数の上記音声区間に渡って繰り返し、複数の上記音声区間に渡って上記音声に最適に対応する標準パターンを特定することを特徴とする音声認識システム。
IPC (3件):
G10L 5/06
, G10L 3/00 561
, G10L 3/00
FI (3件):
G10L 5/06 D
, G10L 3/00 561 C
, G10L 3/00 561 H
引用特許:
前のページに戻る