特許
J-GLOBAL ID:200903078129760120
音声認識装置
発明者:
出願人/特許権者:
代理人 (1件):
丸山 隆夫
公報種別:公開公報
出願番号(国際出願番号):特願2001-022358
公開番号(公開出願番号):特開2002-229592
出願日: 2001年01月30日
公開日(公表日): 2002年08月16日
要約:
【要約】【課題】 音声認識装置において、入力音声を分析して特徴を認識することにより、音声を入力する人に適合する1つの音声認識辞書を選択する方法があるが、体調により認識率が低下することがある。【解決手段】 画像認識部116で話者を特定し、あらかじめ用意した複数の話者の音声認識辞書108から特定した話者に適合した音声認識辞書108に切り替えて音声認識を行い認識結果を出力する。
請求項(抜粋):
話者の音声を入力して音声データに変換する音声入力手段と、変換された前記音声データを処理して音声処理データとする音声処理手段と、前記音声処理データと音声認識辞書のデータと、を比較して音声認識する音声認識手段と、前記話者の画像を入力して画像データに変換する画像入力手段と、変換された前記画像データを処理して画像処理データとする画像処理手段と、前記画像処理データと画像認識辞書のデータと、を比較して画像認識する画像認識手段と、を具備した音声認識装置であって、前記画像認識手段により前記話者を特定し、特定した前記話者に適合した前記音声認識辞書に切り替える手段および複数の前記話者に適合した前記音声認識辞書を備えることにより、複数の前記話者に対しての認識率を向上させることを特徴とする音声認識装置。
IPC (3件):
G10L 17/00
, G10L 15/06
, G10L 15/10
FI (3件):
G10L 3/00 545 F
, G10L 3/00 521 F
, G10L 3/00 531 K
Fターム (3件):
5D015AA03
, 5D015GG01
, 5D015HH21
前のページに戻る