特許
J-GLOBAL ID:200903085115850157
音声認識装置および音声認識方法、音声認識プログラム、並びに、プログラム記録媒体
発明者:
出願人/特許権者:
代理人 (3件):
青山 葆
, 河宮 治
, 山崎 宏
公報種別:公開公報
出願番号(国際出願番号):特願2002-167217
公開番号(公開出願番号):特開2004-012883
出願日: 2002年06月07日
公開日(公表日): 2004年01月15日
要約:
【課題】認識対象単語および処理時間を増加させずに長音化に対処する。【解決手段】音響モデル格納部3には、長音化の可能性を表す特別な2つの音素「i/e」,「u/o」のHMMを追加している。また、単語辞書6には、辞書作成部7によって、各認識対象単語中に存在する長音化の可能性がある音節を上記特別な音素「i/e」,「u/o」で表記して作成された認識対象単語が格納される。その場合、単語辞書6に登録される単語数は上記認識対象単語数と同じであり、登録単語数および処理時間を増加させることはない。そして、尤度演算部2による尤度演算時および辞書照合部5による辞書照合時には、入力音声中に長音化する可能性がある単語が存在していても、その単語が長音化されている場合でも長音化されていない場合でも対処可能であり、認識率の低下を招くことはない。【選択図】 図1
請求項(抜粋):
サブワードを認識単位とすると共に、サブワード音響モデルを用いて入力音声を認識する音声認識装置であって、
入力音声を分析して特徴パラメータの時系列を得る音響分析処理手段と、
長音化の可能性を表すサブワードを含むサブワードの音響モデルである上記サブワード音響モデルが格納された音響モデル格納手段と、
上記長音化の可能性を表すサブワードを含むサブワードの時系列であるサブワード系列で表された認識対象単語が格納された単語辞書と、
上記特徴パラメータの時系列と上記サブワード音響モデルとの照合を行って各サブワードの尤度を得、この得られた各サブワードの尤度と上記認識対象単語のサブワード系列との照合を行って最も尤度の高い認識対象単語を認識結果として生成する照合手段
を備えたことを特徴とする音声認識装置。
IPC (3件):
G10L15/06
, G10L15/10
, G10L15/14
FI (3件):
G10L3/00 521J
, G10L3/00 531Z
, G10L3/00 535Z
Fターム (2件):
引用特許:
審査官引用 (6件)
-
特開昭61-177573
-
特開昭63-239499
-
特開昭61-032138
全件表示
前のページに戻る