特許
J-GLOBAL ID:200903062534734094
音声認識方法
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平5-239494
公開番号(公開出願番号):特開平7-092990
出願日: 1993年09月27日
公開日(公表日): 1995年04月07日
要約:
【要約】【目的】 実際のシステムまたはサービスに適用されている音声信号の認識を利用者を煩わすことなく確実に行う。【構成】 電話音声に適用した例を述べる。音声信号の品質劣化要因として、周波数帯域の制限、伝送路の周波数特性、回線ノイズ、背景ノイズ、各ひな形となる特性を示すテンプレートを作成し(S2 )、これらテンプレートを網羅する組合せを作り(S4 )、その組合せの特性を、既存の音声認識の学習音声データベースの高品質音声データに分析処理の過程で作用させて模擬音声を作り(S5 )、その模擬音声を用いて隠れマルコフモデルを作り(S6 )、そのモデルを用いて未知の電話音声を認識する。
請求項(抜粋):
あらかじめ蓄積された音声信号データを用いて認識対象とする音声信号のモデルを学習して求め、前記学習によって求められた音声信号のモデルに対する類似度を比較することによって未知の音声信号を認識する方法において、音声信号の品質を劣化させる各々の要因を抽出し、前記各要因ごとに当該各要因の1つの特性または互いに異なる複数の特性に対するひな形となるテンプレートを作成し、前記各要因の各々の特性に対するテンプレートを網羅する形式で組合せを作成し、前記のすべての組合せで与えられる互いに異なる特性を信号処理によってあらかじめ蓄積された音声信号データに作用させて模擬音声信号データを得、これら模擬音声信号データごとに前記モデルを学習し、この学習によって得られたすべてのモデルを用いて未知の音声信号を認識することを特徴とする音声認識方法。
IPC (3件):
G10L 3/00 521
, G10L 3/00
, G10L 3/00 535
前のページに戻る