特許
J-GLOBAL ID:200903049052510559

音声認識方法および音声認識装置ならびに音声認識プログラム

発明者:
出願人/特許権者:
代理人 (1件): 磯野 道造
公報種別:公開公報
出願番号(国際出願番号):特願2002-071638
公開番号(公開出願番号):特開2003-271179
出願日: 2002年03月15日
公開日(公表日): 2003年09月25日
要約:
【要約】【課題】 特定話者の音響モデル等を記憶させる大容量の記憶媒体を必要とすることなく、予め特定話者を判別する必要がなく話者適応化による音声認識を行える音声認識方法、装置、プログラムを提供する。【解決手段】 音声認識の対象となる音声信号の各音素が複数の統計分布で構成される音響モデルと、各単語間の関係が統計分布で構成される言語モデルと、単語と音素との関係を示す単語の発音辞書とを使用する音声認識装置1であって、適応化したい話者が発した音声を予め音声認識した結果に基づいて、前記音響モデルの複数の統計分布の中から、出力確率の高い統計分布を特定する統計分布特定手段3aと、前記話者が発声する場合、前記統計分布特定手段で特定された統計分布に基づいて、認識対象となる認識対象音声を認識する音声認識手段3bと、を備えた。
請求項(抜粋):
音声認識の対象となる音声信号の各音素が複数の統計分布で構成される音響モデルと、各単語間の関係が確率で表現されている言語モデルと、単語と音素との関係を示す単語の発音辞書とを使用する音声認識方法であって、適応化したい話者が発した音声を予め音声認識した結果に基づいて、前記音響モデルの複数の統計分布の中から、出力確率の高い統計分布を特定する統計分布特定ステップと、前記話者が発声する場合、前記統計分布特定ステップにおいて特定された統計分布に基づいて、認識対象となる認識対象音声を認識する音声認識ステップと、を含むことを特徴とする音声認識方法。
IPC (3件):
G10L 15/06 ,  G10L 15/14 ,  G10L 15/18
FI (3件):
G10L 3/00 521 S ,  G10L 3/00 535 A ,  G10L 3/00 537 D
Fターム (2件):
5D015GG04 ,  5D015HH23
引用特許:
出願人引用 (1件) 審査官引用 (1件)
引用文献:
前のページに戻る