特許
J-GLOBAL ID:200903028999640467
音声認識装置および音声認識方法、並びに、プログラム記録媒体
発明者:
,
,
出願人/特許権者:
代理人 (1件):
青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-220576
公開番号(公開出願番号):特開2002-041078
出願日: 2000年07月21日
公開日(公表日): 2002年02月08日
要約:
【要約】【課題】 自動的に認識対象語彙を切り換える場合でも高認識精度を得る。【解決手段】 認識部25は、音響モデル格納部26の音響モデルを用いて第1,第2認識対象語彙セット格納部27に格納された認識対象語彙セットA,Bを構成する単語の尤度Pを算出する。その際に、出力部32の表示内容の切り換えに伴う認識対象語彙セットの切り換えは、切り換え前後の認識対象語彙セットを構成する単語の尤度Pに掛ける重みw1,w2の値を切り換え要求時刻t0からの経過時間に比例して「1」と0近傍の所定値「a」との間で切り換えることで行う。その結果、話者が認識対象語彙の発声の機会を逸し、且つ、自動的に認識対象語彙が切り換えられても、切り換え前の認識対象語彙セットの単語に関する尤度w・Pの計算も行われるために、話者が切り換え前の認識対象語彙で発声しても高い認識結果が得られる。
請求項(抜粋):
入力された音声を認識する認識部と、この認識部の認識結果を含む情報を出力する出力部と、上記認識時に用いられる認識対象語彙が格納された認識語彙格納部と、タイマ部と、このタイマ部からの時刻信号に基づいて上記認識対象語彙の切り換えを要求する認識対象語彙切り換え要求部を有する音声認識装置において、上記出力部は、複数の出力内容を切り換え出力するようになっており、上記認識対象語彙は、上記出力部の出力内容に対応した認識対象語の集合でなる複数の認識対象語彙セットに分類され、上記認識対象語彙の切り換えは上記認識対象語彙セットの単位で行われるようになっており、上記タイマ部からの時刻信号に基づいて、上記各認識対象語彙セット用の重みを決定する重み決定部を備えて、上記認識部は、上記全認識対象語彙セットおよび上記決定された各重みを用いて、入力音声を認識するようになっていることを特徴とする音声認識装置。
IPC (4件):
G10L 15/06
, G10L 15/10
, G10L 15/00
, G10L 15/28
FI (3件):
G10L 3/00 521 V
, G10L 3/00 531 G
, G10L 3/00 551 P
Fターム (7件):
5D015AA04
, 5D015BB02
, 5D015HH05
, 5D015HH11
, 5D015HH21
, 5D015KK02
, 5D015LL10
引用特許:
前のページに戻る