特許
J-GLOBAL ID:200903058558512010

音声認識装置、方法及びプログラムを記憶した記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 丸山 隆夫
公報種別:公開公報
出願番号(国際出願番号):特願平11-100990
公開番号(公開出願番号):特開2000-293196
出願日: 1999年04月08日
公開日(公表日): 2000年10月20日
要約:
【要約】【課題】 統計的な言語情報に基づいて得られた認識結果候補について、言語知識を用いて適合性を判定することにより、精度の高い認識結果を得る。【解決手段】 マイクロフォン102から入力された入力音声101は、音響分析部103によって分析され音響特徴量系列104が抽出される。候補生成部105では、入力された音響特徴量系列104に対して、音響モデル106の与える尤度と言語モデル107が与える尤度との積が最大となるような単語系列からなる正解候補、及びそれに続く尤度をもつ複数の正解候補を生成し、単語グラフ108の形式で出力する。単語グラフ108は、リスコアリング部109において文法適合性が判定される。即ち、単語グラフ108は、パースフィルタ110によって言語知識111を用いてフィルタリングされ、認識結果112が出力される。
請求項(抜粋):
音声を入力する入力手段と、前記入力された音声を分析して特徴量を抽出する抽出手段と、前記抽出された特徴量から音響モデルと言語モデルを用いて複数の正解候補をそれぞれ単語列として生成する候補生成手段と、前記複数の正解候補として得られた各単語列の文法適合性を判定する判定手段と、前記複数の正解候補のうち前記判定手段により判定された最尤の一個又は上位尤度のN個を選択して出力するリスコアリング手段とを備えたことを特徴とする音声認識装置。
IPC (2件):
G10L 15/28 ,  G10L 15/18
FI (2件):
G10L 5/06 F ,  G10L 3/00 537 D
Fターム (5件):
5D015AA01 ,  5D015BB01 ,  5D015CC18 ,  5D015HH14 ,  5D015HH15
引用特許:
審査官引用 (4件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平9-161243   出願人:株式会社エイ・ティ・アール音声翻訳通信研究所
  • 音声認識方法
    公報種別:公開公報   出願番号:特願平7-041948   出願人:日本電信電話株式会社
  • 連続音声認識装置
    公報種別:公開公報   出願番号:特願平8-330679   出願人:株式会社エイ・ティ・アール音声翻訳通信研究所
全件表示

前のページに戻る