特許
J-GLOBAL ID:200903044166076326

機器制御システム、音声認識装置及び方法、並びにプログラム

発明者:
出願人/特許権者:
代理人 (1件): 木村 満
公報種別:公開公報
出願番号(国際出願番号):特願2001-242995
公開番号(公開出願番号):特開2003-058184
出願日: 2001年08月09日
公開日(公表日): 2003年02月28日
要約:
【要約】【課題】 環境条件に応じて単語が発せられる確率を考慮することで、精度の高い音声認識結果を得る。【解決手段】 音響尤度計算部108は、音素モデル及び単語辞書を参照して、マイクロフォン3から入力された音声を音素的要素及び言語的要素に従って音声認識し、発音の確率を示す音響尤度が最も高い単語を候補として抽出する。環境尤度計算部210は、計時部301、温度センサ302及び照度センサ303から入力される環境条件に従って時間モデル、温度モデル及び照度モデルを参照し、環境条件によって発音される確率を示す環境尤度を求める。尤度評価部221は、音響尤度計算部108が求めた音響尤度と環境尤度計算部210が求めた環境尤度とを乗算し、その乗算結果を単語尤度として求める。そして、求めた単語尤度が所定の閾値よりも大きい場合に、音響尤度計算部108が候補として抽出した単語を音声認識結果として出力部222から出力する。
請求項(抜粋):
音声入力手段に接続され、該音声入力手段から入力された音声を音声認識して、その音声認識結果を出力する音声認識手段と、制御対象となる機器に接続され、前記音声認識手段の音声認識結果に基づいて前記機器を制御する機器制御手段とを備える機器制御システムであって、前記音声認識手段は、認識対象となる音声に含まれる各音素をモデル化した音素モデルを格納した音素モデル格納手段と、認識結果として出力されるべき複数種類の単語の音素パターン系列をそれぞれ登録した単語辞書を格納した単語辞書格納手段と、前記単語辞書格納手段に格納された各単語が環境条件によって発話される確率をモデル化した環境モデルを格納した環境モデル格納手段と、前記音声入力手段から入力された音声を前記音素モデル及び前記単語辞書を参照して、前記単語辞書に登録された各種類の単語の最大音響尤度を算出し、該算出した音響尤度に対応する単語を、認識結果として出力される単語の候補として選出する単語候補選出手段と、環境条件を検知する検知手段に接続され、該検知手段が検知した環境条件に従って前記環境モデルを参照して、前記単語候補選出手段が候補として選出した単語の環境尤度を算定する環境尤度算出手段と、前記単語候補選出手段が算出した音響尤度と前記環境尤度算出手段が算出した環境尤度に基づいて単語尤度を算出する単語尤度算出手段と、前記単語尤度算出手段が算出した単語尤度が所定の範囲にあるかどうかを判定する単語尤度判定手段と、前記単語尤度判定手段が所定の範囲にあると判定したときに、前記単語候補選出手段が候補として選出した単語を音声認識結果として、前記機器制御手段に出力する結果出力手段とを備えることを特徴とする機器制御システム。
IPC (2件):
G10L 15/10 ,  G10L 15/00
FI (2件):
G10L 3/00 531 G ,  G10L 3/00 551 F
Fターム (2件):
5D015HH05 ,  5D015KK01
引用特許:
審査官引用 (3件)

前のページに戻る