特許
J-GLOBAL ID:200903091931075323

音声認識装置およびこの音声認識装置で使用する標準パターンの作成方法

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-292474
公開番号(公開出願番号):特開平10-133681
出願日: 1996年11月05日
公開日(公表日): 1998年05月22日
要約:
【要約】【課題】 計算量の増加を押さえて、入力パターンの経時的な揺らぎに対する頑健性を付与した音声認識装置を提供する。【解決手段】 相対フレーム番号決定部6は、学習音声サンプル格納部8の学習音声サンプルを用いて相対フレーム番号を決定し、相対フレーム番号格納部10に格納する。標準パターン作成部7は、相対フレーム番号と学習音声サンプルとを用いてネットワーク状標準パターンを作成し、パターン記憶部4に記憶する。パターン比較部3は、ネットワーク状標準パターンと音声分析部2からの入力パターンとの3次元マッチングを行う。こうして、入力パターンの経時的な揺らぎに対して容易に追従可能にする。また、同じ認識性能を有するマルチテンプレート標準パターンよりも標準パターンの特徴ベクトル数を少なくして、パターン記憶部4の記憶量とパターン比較部3の計算量を少なくする。
請求項(抜粋):
話者の発声音声をフレーム分析して特徴時系列に変換する音声分析部と、この音声分析部からの特徴時系列のパターンと標準パターン記憶部に記憶された標準パターンとのパターンマッチングを行って両パターンの比較を行うパターン比較部と、このパターン比較部による比較結果に基づいて音声認識結果を判定する認識結果判定部を有する音声認識装置であって、上記標準パターン記憶部に記憶されている標準パターンは、時間軸方向に複数のフレームが存在すると共に、同一フレームには複数の特徴が属しており、各特徴が夫々の特徴が属しているフレームに隣接するフレームに属する総ての特徴と遷移経路で結ばれたネットワーク構造を有するネットワーク状標準パターンであり、上記パターン比較部は、上記ネットワーク状標準パターンの各特徴と入力音声の特徴時系列パターンとの時間軸の対応付けを表す多次元格子上の最尤経路を探索するDPマッチングを行うことを特徴とする音声認識装置。
IPC (2件):
G10L 3/00 533 ,  G10L 3/00 521
FI (2件):
G10L 3/00 533 B ,  G10L 3/00 521 C

前のページに戻る