特許
J-GLOBAL ID:200903056225935832
音声認識装置
発明者:
,
出願人/特許権者:
代理人 (1件):
青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-283515
公開番号(公開出願番号):特開2002-091469
出願日: 2000年09月19日
公開日(公表日): 2002年03月27日
要約:
【要約】【課題】 話者の方向又は位置を推定して音声認識率を向上させることができる音声認識装置を提供する。【解決手段】 複数のマイクロホンを所定の間隔で並置してなるマイクロホンアレー10を備えた音声認識装置において、方向推定部13は、各マイクロホンから出力される電気信号に基づいてマイクロホンアレーで受信される少なくとも1つの音源の方位角を推定し、ビームフォーミング部14は、各マイクロホンから出力される電気信号に基づいて推定された少なくとも1つの音源の方位角の方向に対応する少なくとも1つのビーム信号を生成する。次いで、音源判定部16は各ビーム信号に基づいて音声のHMMと雑音HMMとを用いて各ビーム信号が音声であるか非音声であるかを判定し、音声認識部17は音声であると判定されたときに、当該ビーム信号に対して音声認識を行って音声認識結果を出力する。
請求項(抜粋):
複数のマイクロホンを所定の間隔で並置してなるマイクロホンアレーと、上記各マイクロホンから出力される電気信号に基づいて上記マイクロホンアレーで受信される少なくとも1つの音源の方位角又は位置を推定する推定手段と、上記各マイクロホンから出力される電気信号に基づいて上記推定手段により推定された少なくとも1つの音源の方位角又は位置の方向に対応する少なくとも1つのビーム信号を生成するビームフォーミング手段と、上記ビームフォーミング手段により生成された少なくとも1つのビーム信号に基づいて、音声の隠れマルコフモデルと、雑音の隠れマルコフモデルとを用いて、上記各ビーム信号が音声であるか非音声であるかを判定する判定手段と、上記判定手段により音声であると判定されたときに、当該ビーム信号に対して音声認識を行って音声認識結果を出力する音声認識手段とを備えたことを特徴とする音声認識装置。
IPC (5件):
G10L 11/02
, G10L 15/04
, G10L 15/28
, G10L 15/14
, H04R 1/40 320
FI (4件):
H04R 1/40 320 A
, G10L 3/00 513 C
, G10L 3/00 511
, G10L 3/00 535 Z
Fターム (4件):
5D015DD02
, 5D015DD03
, 5D015HH23
, 5D018BB22
引用特許:
審査官引用 (6件)
-
音声区間検出方法
公報種別:公開公報
出願番号:特願平9-060236
出願人:日本電信電話株式会社
-
音声認識における話者適応方法
公報種別:公開公報
出願番号:特願平5-055331
出願人:株式会社エイ・ティ・アール自動翻訳電話研究所
-
パターン認識装置
公報種別:公開公報
出願番号:特願平9-253632
出願人:日本電気株式会社
全件表示
引用文献: