特許
J-GLOBAL ID:200903089464086060

情報処理装置および方法、並びに提供媒体

発明者:
出願人/特許権者:
代理人 (1件): 稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願平10-120542
公開番号(公開出願番号):特開平11-311994
出願日: 1998年04月30日
公開日(公表日): 1999年11月09日
要約:
【要約】【課題】 認識率をより向上させる。【解決手段】 特徴抽出部12は、マイク11を介して入力された音声信号から特徴ベクトルを抽出し、照合部16に出力する。照合部16は、音韻モデル記憶部13の音韻モデル、辞書記憶部14の辞書、文法記憶部15の文法を参照して、少なくとも1つ以上の認識結果候補を生成し、ワードグラフとして認識結果記憶部17に記憶させる。正規化継続時間計算部18は、認識結果候補を構成している個々の単語の継続時間長と、各単語の継続時間長の合計との比を表す正規化継続時間長を算出し、ワードグラフの対応するアーク情報に付加する。認識結果制御部20は、認識結果候補を構成する数字の正規化継続時間長と、継続時間閾値記憶部19に記憶されてる閾値を比較し、比較結果に対応して、認識結果候補の受理または棄却を制御する。
請求項(抜粋):
音声信号を入力する入力手段と、前記入力手段により入力された前記音声信号を認識し、少なくとも1つ以上の認識結果候補を生成する生成手段と、前記生成手段により生成された前記認識結果候補を構成している個々の単語の継続時間長と前記各単語の継続時間長の合計との比を表す正規化継続時間長を算出する算出手段と、前記算出手段により算出された前記正規化継続時間長に基づいて、前記認識結果候補の受理または棄却を制御する制御手段とを備えることを特徴とする情報処理装置。
IPC (3件):
G10L 3/00 561 ,  G10L 3/00 535 ,  G10L 9/00 301
FI (3件):
G10L 3/00 561 B ,  G10L 3/00 535 ,  G10L 9/00 301 C

前のページに戻る