特許
J-GLOBAL ID:200903031791285230

音素認識方法、音素認識装置および音素認識プログラム

発明者:
出願人/特許権者:
代理人 (1件): 磯野 道造
公報種別:公開公報
出願番号(国際出願番号):特願2002-180146
公開番号(公開出願番号):特開2004-021207
出願日: 2002年06月20日
公開日(公表日): 2004年01月22日
要約:
【課題】音素の境界を示す区間情報を保持するためのメモリー量を増大させることなく、音素認識率を向上することができる音素認識方法、装置およびプログラムを提供する。【解決手段】音素認識の対象となる音声信号の各音素の特徴が定義されている音響モデルと、各単語間の関係が確率で表現されている言語モデルと、単語と音素との関係を示す単語の発音辞書とを使用して、音素を認識する音素認識装置1であって、連続した音声信号を音声認識する音声認識部5と、音声認識結果を用いて、音声波形と音素との対応付けであるアラインメントを行い、前記音素の境界を示す区間情報と、前記音素毎に付されている音素ラベルとを得るアラインメント部7と、を備えた。【選択図】 図1
請求項(抜粋):
音素認識の対象となる音声信号の各音素の特徴が定義されている音響モデルと、各単語間の関係が確率で表現されている言語モデルと、単語と音素との関係を示す単語の発音辞書とを使用して、音素を認識する音素認識方法であって、 前記音響モデル、前記言語モデルおよび前記発音辞書を利用して連続した音声信号を音声認識する連続音声認識ステップと、 この連続音声認識ステップにおける音声認識結果を用いて、音声波形と音素との対応付けであるアラインメントを行い、前記音素の境界を示す区間情報と、前記音素毎に付されている音素ラベルとを得るアラインメントステップと、 を含むことを特徴とする音素認識方法。
IPC (2件):
G10L15/18 ,  G10L15/12
FI (2件):
G10L3/00 537H ,  G10L3/00 533A
Fターム (3件):
5D015AA01 ,  5D015BB02 ,  5D015HH07
引用特許:
審査官引用 (10件)
全件表示
引用文献:
審査官引用 (3件)
  • 確率モデルによる音声認識, 19880701, p.109〜110
  • 確率モデルによる音声認識, 19880701, p.109〜110
  • 確率モデルによる音声認識, 19880701, p.109〜110

前のページに戻る