特許
J-GLOBAL ID:200903052402030580

音声認識装置

発明者:
出願人/特許権者:
代理人 (2件): 西川 惠清 ,  森 厚夫
公報種別:公開公報
出願番号(国際出願番号):特願2007-292369
公開番号(公開出願番号):特開2009-116277
出願日: 2007年11月09日
公開日(公表日): 2009年05月28日
要約:
【課題】誤認識があったとしても誤認識が繰り返されないように誤認識の発生後における音声認識の精度を確実に向上させる。【解決手段】マイク部1は、使用者の音声が入力さると音声データを作成する。音声認識処理部4は、特徴量抽出部2で作成された音声データの特徴量と音声データベース3の語彙の特徴量とを照合し、類似度上位の所定個数の語彙を選択する。認識制御部6は、類似度最上位の語彙の類似度が閾値を超えていない場合、所定個数の語彙と類似度順位とを表示部8に表示させる。使用者によって正解通知情報が認識結果入力部5に入力されると、認識制御部6は、類似度最上位の語彙を正しい語彙と判定する。一方、正解通知情報が入力されずに一定時間内に使用者の音声がマイク部1に再入力された場合、類似度最上位の語彙が選択対象外として記憶部7に記憶されて、マイク部1、特徴量抽出部2、音声認識処理部4、認識制御部6が再動作する。【選択図】図1
請求項(抜粋):
音声認識の対象となる音声が入力される音声入力手段と、 前記音声入力手段に入力された音声に基づく音声データの特徴量を抽出する特徴量抽出部と、 音声認識が可能な語彙の特徴量が予め登録されている音声データベースと、 前記音声データの特徴量と前記音声データベースの前記語彙の特徴量とを照合し、当該音声データとの類似度が高い特徴量に対応する語彙を選択する音声認識処理部と、 前記音声認識処理部で選択された語彙が正しい旨を表わす正解通知情報を入力するための手段を有する認識結果入力手段と、 前記正解通知情報が所定時間内に入力された場合、前記音声認識処理部で選択された語彙を正しい語彙と判定する一方、前記正解通知情報が前記所定時間内に入力されなかった場合、前記音声認識処理部で選択された語彙を誤った語彙と判定する判定動作を行う判定手段と、 前記判定手段で判定された前記誤った語彙を記憶する記憶部と、 前記判定手段によって前記音声認識処理部で選択された語彙が誤った語彙と判定された場合、前記音声認識処理部が次の語彙に対応する音声に基づく音声データとの類似度が高い特徴量に対応する語彙を選択するときに前記誤った語彙を選択対象外とする旨の制限命令情報を前記音声認識処理部に出力する一方、前記判定手段によって前記音声認識処理部で選択された語彙が正しい語彙と判定された場合、当該正しい語彙に基づく情報を出力する制御手段と を備えることを特徴とする音声認識装置。
IPC (2件):
G10L 15/22 ,  G10L 15/00
FI (5件):
G10L15/22 460Z ,  G10L15/22 470Z ,  G10L15/00 200N ,  G10L15/22 470F ,  G10L15/22 200V
Fターム (1件):
5D015LL04
引用特許:
出願人引用 (1件)

前のページに戻る