特許
J-GLOBAL ID:200903080824235642

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 宮田 金雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-093053
公開番号(公開出願番号):特開平11-288297
出願日: 1998年04月06日
公開日(公表日): 1999年10月19日
要約:
【要約】【課題】 発声内に複数の未知語が含まれている場合にそれらが同一であるかを区別する。【解決手段】 検出した未知語のそれぞれ最適な状態遷移モデルを確定する未知語モデル決定手段104と、それらの最適な状態遷移モデルを記憶する未知語モデル記憶手段109と、それらの最適な状態遷移モデル同士を比較し、それらの未知語が同一のものか、別種の未知語であるかを判定する未知語判定手段105を備えた。発声内に複数の未知語が含まれている場合にそれらが同一であるかを区別することができるので、利用者は未知語が同一のものであったか、異なったものであったを容易に知ることができる。
請求項(抜粋):
音声データを入力する音声取得手段と、前記音声データから音声特徴ベクトルを抽出する音響分析手段と、登録単語の連鎖を定義する単語ネットワーク辞書と、登録単語の状態遷移モデルを記憶する単語辞書と、未知語用の状態遷移モデルを記憶する未知語用辞書と、前記音声特徴ベクトルをもとに認識処理を行い認識中間結果を出力する認識手段と、前記認識中間結果内の1ないし複数の未知語のそれぞれ最適な状態遷移モデルを確定する未知語モデル決定手段と、前記未知語モデル決定手段によって決定した1ないし複数の未知語のそれぞれ最適な状態遷移モデルを記憶する未知語モデル記憶手段と、前記未知語モデル記憶手段に記憶した複数の未知語のそれぞれ最適な状態遷移モデル同士を比較し、それらの未知語が同一のものか、別種の未知語であるかを判定する未知語判定手段とを備えることを特徴とする音声認識装置。
IPC (4件):
G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 535 ,  G10L 3/00 561
FI (4件):
G10L 3/00 531 P ,  G10L 3/00 531 D ,  G10L 3/00 535 ,  G10L 3/00 561 G

前のページに戻る