特許
J-GLOBAL ID:200903045894694709

音声認識方法及びそのプログラム記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平9-248351
公開番号(公開出願番号):特開平11-085188
出願日: 1997年09月12日
公開日(公表日): 1999年03月30日
要約:
【要約】【課題】 語彙制約なし認識系による尤度正規化の場合に、部分的に数個の音素だけが異なる場合に、尤度正規化が効果的に働かなくなる。【解決手段】 入力音声から特徴パラメータXtを抽出し(13)、そのXtに対し、HMMの確率が大きくなるものを順に候補とし(33)、音素での対象とするカテゴリで得られる確率と、他のカテゴリで得られる確率との分布差に基づいて変量、例えば対象カテゴリの確率を、非対象カテゴリの確率で割ったものを予め統計的にモデル化しておき、そのモデルから計算される確率(信頼度尤度計算部34で求める)を認識候補全体の確率に掛け合せ、これを経路ごとに累積し(32)、ネットワーク探索部31で尤度の高い候補を残しながら探索する。
請求項(抜粋):
入力される音声信号をディジタル信号に変換し、そのディジタル信号から音声特徴パラメータを抽出し、その抽出した音声特徴パラメータに対して言語的単位の各カテゴリの特徴を表現した確率モデルの確率を計算し、最も高い確率を示すモデルが表現するカテゴリを認識結果として出力する音声認識方法において、音素、音節、単語などの部分区間での、対象とするカテゴリで得られる確率と、他のカテゴリでの確率との分布差に基づいて求められる変量を、あらかじめ統計的にモデル化しておき、そのモデルから計算される確率を認識候補全体の確率に掛け合わせる、ことを特徴とする音声認識方法。
IPC (3件):
G10L 3/00 535 ,  G10L 3/00 531 ,  G10L 3/00 561
FI (3件):
G10L 3/00 535 ,  G10L 3/00 531 E ,  G10L 3/00 561 B
引用特許:
審査官引用 (5件)
全件表示

前のページに戻る