特許
J-GLOBAL ID:200903066868668047
音声認識方法及び音声認識装置
発明者:
,
,
出願人/特許権者:
代理人 (1件):
河野 登夫
公報種別:公開公報
出願番号(国際出願番号):特願平7-122843
公開番号(公開出願番号):特開平8-314500
出願日: 1995年05月22日
公開日(公表日): 1996年11月29日
要約:
【要約】【目的】 ニューラルネットワークを利用して音声認識、特に複数桁の数字列を構成する個々の数字を音声認識する場合の、ニューラルネットワークの入力層に与えるべきデータの切り出しを工夫することにより、一般的な3層のニューラルネットワークを利用しても実用上充分な認識率が得ることを目的とする。【構成】 認識対象として発声された音声信号を分析する音声分析部130 と、これにより得られたデータの内の第1の閾値以上である部分を取り込む一次切り出しを行なうことにより音声信号の時系列推移のデータを求め、求められたデータの内の第2の閾値以上である部分を認識処理の対象として取り込む二次切り出しを行なう音声区間検出部132 と、二次切り出しにより得たデータを対象として音声認識処理を行なうニューロ演算部134 とを備え、音声区間検出部132 が一次切り出しにより得られたデータの最大値に応じて第2の閾値を動的に設定する。
請求項(抜粋):
認識対象として発声された音声信号を分析して得られたデータの内の第1の閾値以上である部分を取り込む一次切り出しを行なうことにより音声信号の時系列推移のデータを求め、前記一次切り出しにより求められたデータの内の第2の閾値以上である部分を認識処理の対象として取り込む二次切り出しを行ない、前記二次切り出しにより得られたデータを対象として音声認識処理を行なう音声認識方法において、前記二次切り出しを行なうための第2の閾値を、前記一次切り出しにより得られたデータの最大値に応じて動的に設定することを特徴とする音声認識方法。
IPC (3件):
G10L 9/10 301
, G06F 15/18 560
, G10L 3/00 513
FI (3件):
G10L 9/10 301 C
, G06F 15/18 560 G
, G10L 3/00 513 D
引用特許: