特許
J-GLOBAL ID:200903045745704602

音声認識装置及び音声認識プログラム

発明者:
出願人/特許権者:
代理人 (1件): 伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2007-011422
公開番号(公開出願番号):特開2008-176202
出願日: 2007年01月22日
公開日(公表日): 2008年07月31日
要約:
【課題】高精度な音声認識を実現する。【解決手段】学習用の音声信号及び該音声信号に対応して書き起こされたテキストから学習した確率モデルを用いて、入力される認識対象の音声信号に対する音声認識を行う音声認識装置において、前記学習用の音声信号に対して音響特徴量の分析を行う音響分析手段と、前記テキストに対して形態素解析を行う形態素解析手段と、前記音響分析手段及び前記形態素解析手段の結果から所定処理時間毎における音声と文字の対応関係を生成するアライメント生成手段と、前記アライメント生成手段により得られる前記対応関係に基づいて、音声と言語の相関関係確率モデルを学習する相関関係確率学習手段と、前記相関関係確率学習手段により得られる相関関係確率モデルに基づいて、前記認識対象の音声信号に対する音声認識を行う音声認識手段とを有することにより、上記課題を解決する。【選択図】図1
請求項(抜粋):
学習用の音声信号及び該音声信号に対応して書き起こされたテキストから学習した確率モデルを用いて、入力される認識対象の音声信号に対する音声認識を行う音声認識装置において、 前記学習用の音声信号に対して音響特徴量の分析を行う音響分析手段と、 前記テキストに対して形態素解析を行う形態素解析手段と、 前記音響分析手段及び前記形態素解析手段の結果から所定処理時間毎における音声と文字の対応関係を生成するアライメント生成手段と、 前記アライメント生成手段により得られる前記対応関係に基づいて、音声と言語の相関関係確率モデルを学習する相関関係確率学習手段と、 前記相関関係確率学習手段により得られる相関関係確率モデルに基づいて、前記認識対象の音声信号に対する音声認識を行う音声認識手段とを有することを特徴とする音声認識装置。
IPC (5件):
G10L 15/06 ,  G10L 15/28 ,  G10L 15/08 ,  G10L 15/10 ,  G10L 15/14
FI (6件):
G10L15/06 300C ,  G10L15/28 370Z ,  G10L15/08 200J ,  G10L15/08 300Z ,  G10L15/10 300G ,  G10L15/14 200Z
Fターム (4件):
5D015CC06 ,  5D015GG00 ,  5D015HH11 ,  5D015HH21
引用特許:
審査官引用 (6件)
全件表示

前のページに戻る