特許
J-GLOBAL ID:200903041090880989

音声認識装置及び記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 足立 勉
公報種別:公開公報
出願番号(国際出願番号):特願平11-359076
公開番号(公開出願番号):特開2001-175276
出願日: 1999年12月17日
公開日(公表日): 2001年06月29日
要約:
【要約】【課題】認識結果に対する信頼度を適切に評価可能な指標としての正解確率を得ることで、アプリケーション構築を容易ならしめる音声認識装置を提供する。【解決手段】正解確率推定部14は、パターンマッチング部13から「信頼度評価用特徴量」として、単語と音節連接モデルの尤度比や、単語内の音節の継続時間の分散に基づいて認識結果の正解確率の推定を行い、出力する。したがって、対話制御部50は、パターンマッチング部13から出力された認識結果に対応する正解確率を正解確率推定部14から取得できる。つまり対話制御部50は、例えば正解確率が95%の認識結果であれば確信して対話を進めるが、50%ならば確認を求める、といった誤認識を考慮した対処を行うことができる。また、信頼度として正解確率を用いているので、アプリケーション構築する際、信頼度を直観的に理解できるという効果もある。
請求項(抜粋):
外部から入力された音声を所定周期で音響的に分析する音響分析手段と、その音響分析手段にて分析された結果を基に特徴パラメータを抽出する特徴抽出手段と、その特徴抽出手段にて抽出された特徴パラメータを予め記憶されている複数の比較対象パターンと比較して一致度合いの高いものを認識結果とするパターンマッチング手段とを備える音声認識装置であって、さらに、前記音響分析手段、特徴抽出手段あるいはパターンマッチング手段の少なくとも何れかにおいて得られる所定の信頼度評価用特徴量に基づき、前記認識結果の絶対的な信頼度を推定する信頼度推定手段を備えたことを特徴とする音声認識装置。
IPC (4件):
G10L 15/10 ,  G10L 15/28 ,  G10L101:04 ,  G10L101:12
FI (6件):
G10L101:04 ,  G10L101:12 ,  G10L 3/00 531 F ,  G10L 3/00 561 H ,  G10L 9/14 301 B ,  G10L 9/16 301 B
Fターム (5件):
5D015CC07 ,  5D015CC11 ,  5D015HH04 ,  5D015HH23 ,  5D015LL05
引用特許:
審査官引用 (10件)
  • 特開平3-248199
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平4-306320   出願人:株式会社リコー
  • 特開平3-248199
全件表示

前のページに戻る