特許
J-GLOBAL ID:200903027128040740
マイクロホンアレイ入力型音声認識装置及び方法
発明者:
出願人/特許権者:
代理人 (1件):
鈴江 武彦
公報種別:公開公報
出願番号(国際出願番号):特願平8-059821
公開番号(公開出願番号):特開平9-251299
出願日: 1996年03月15日
公開日(公表日): 1997年09月22日
要約:
【要約】【課題】音源位置または方向の推定が、少ない演算量で高精度に行えるようにすることを主要な課題とする。【解決手段】音声入力部1により入力されるマイクロホンアレイからの入力信号を、周波数分析部2にてバンドパスフィルタバンクにより周波数分析して、周波数帯域ごとのバンドパス波形をマイクロホンチャネル別に求め、このバンドパス波形から音源位置探査部3により音源位置または方向ごとのバンドパスパワー分布を周波数帯域ごとに求めて、そのバンドパスパワー分布を全周波数帯域について統合し、その統合したバンドパスパワー分布から音源位置または方向を推定する。音声パラメータ抽出部4では、この音源位置または方向に基づき、周波数帯域ごとのバンドパスパワー分布から該当するバンドパスパワーを音声パラメータとして抽出し、これを音声認識部5での音声認識に用いる。
請求項(抜粋):
複数のマイクロホンの集合であるマイクロホンアレイを用いて複数チャネルの音声を並列に入力する音声入力手段と、前記音声入力手段により入力された前記複数チャネルの入力音声各々を分析して周波数帯域ごとの波形であるバンドパス波形を前記各チャネル別に求める周波数分析手段と、前記周波数分析手段により求められたバンドパス波形から音源の位置または方向ごとのバンドパスパワー分布を周波数帯域ごとに求めて、そのバンドパスパワー分布を複数の周波数帯域について統合し、その統合したバンドパスパワー分布から音源位置または方向を推定する音源位置探査手段と、前記音源位置探査手段により得られた音源位置または方向に基づき、前記音源探査手段により周波数帯域ごとに求められた前記バンドパスパワー分布から音声認識のためのパラメータである音声パラメータを抽出する音声パラメータ抽出手段と、前記音声パラメータ抽出手段により抽出された音声パラメータを認識辞書と照合して音声認識する音声認識手段とを具備することを特徴とするマイクロホンアレイ入力型音声認識装置。
IPC (2件):
G10L 3/00 511
, G10L 7/08
FI (2件):
G10L 3/00 511
, G10L 7/08 A
引用特許:
審査官引用 (4件)
-
音声認識装置
公報種別:公開公報
出願番号:特願平5-155354
出願人:日本電気株式会社
-
音源方向推定方法
公報種別:公開公報
出願番号:特願平3-249411
出願人:日本電信電話株式会社
-
音源信号推定装置
公報種別:公開公報
出願番号:特願平5-169440
出願人:ソニー株式会社
-
音源信号推定装置
公報種別:公開公報
出願番号:特願平4-356863
出願人:ソニー株式会社
全件表示
前のページに戻る