特許
J-GLOBAL ID:200903053249071864

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 足立 勉
公報種別:公開公報
出願番号(国際出願番号):特願平9-168866
公開番号(公開出願番号):特開平11-015494
出願日: 1997年06月25日
公開日(公表日): 1999年01月22日
要約:
【要約】【課題】 認識対象となる音声と雑音とが混在した入力信号から雑音成分を極力除去することで、音声認識率の向上を実現しながら、よりユーザフレンドリな音声認識装置を提供する。【解決手段】 PTTスイッチがONされるとオーディオ用スピーカから出力される音量が0とされ、その時点からのマイクへの入力信号が音声抽出部での処理対象となる。そして、たとえPTTスイッチがONされた直後から利用者が音声を発したために音声区間より前では必要な雑音信号が取り込めなかった場合であっても、PTTスイッチがOFFされて利用者が指定した入力期間が終了した後の所定期間内において雑音信号を取り込むようにしている。そのため、確実に雑音成分の取り込み及び推定ができ、その結果、認識対象となる音声と雑音とが混在した入力信号から雑音成分を除去することで認識率の向上に寄与する。
請求項(抜粋):
音声を入力するための音声入力手段と、前記音声入力手段を介して入力された認識対象の音声と雑音とが混在した入力信号のパワーに基づき、前記音声が含まれている音声区間と、前記音声が含まれていない雑音区間とを判定する判定手段と、該判定手段によって判定された前記音声区間の入力信号から、前記雑音区間の入力信号に基づいて推定された前記音声区間における雑音成分を除去し、前記認識対象の音声を抽出する音声抽出手段と、前記音声抽出手段によって抽出された音声を、予め記憶されている複数の比較対象パターン候補と比較して一致度合の高いものを認識結果とする認識手段と、前記認識対象の音声を入力させる期間を利用者自身が指定するために設けられた入力期間指定手段と、を備え、前記音声抽出手段は、前記入力期間指定手段によって指定された入力期間内の前記音声区間に含まれる音声を抽出するよう構成されている音声認識装置であって、前記音声抽出手段に対し、前記入力期間指定手段にて指定された入力期間が終了した後の所定期間内における前記雑音区間に取り込んだ入力信号に基づき、前記音声区間における雑音成分を推定させるよう制御する制御手段を備えていることを特徴とする音声認識装置。
IPC (3件):
G10L 3/00 571 ,  G10L 3/02 301 ,  G10L 3/02
FI (3件):
G10L 3/00 571 G ,  G10L 3/02 301 D ,  G10L 3/02 301 C
引用特許:
出願人引用 (3件)
  • 特開平3-003540
  • 音声認識方法
    公報種別:公開公報   出願番号:特願平3-236695   出願人:富士通株式会社
  • 音声認識方式
    公報種別:公開公報   出願番号:特願平4-097880   出願人:富士通株式会社
審査官引用 (4件)
  • 特開平3-003540
  • 音声認識方法
    公報種別:公開公報   出願番号:特願平3-236695   出願人:富士通株式会社
  • 特開平3-003540
全件表示

前のページに戻る