特許
J-GLOBAL ID:200903079681999141

音声適応化装置,単語音声認識装置,連続音声認識装置およびワードスポッティング装置

発明者:
出願人/特許権者:
代理人 (1件): 京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-011042
公開番号(公開出願番号):特開平8-202385
出願日: 1995年01月26日
公開日(公表日): 1996年08月09日
要約:
【要約】【目的】 入力音声の発声内容が未知であっても、高精度な適応化を行なうことが可能な音声適応化装置を提供する。【構成】 入力音声を特徴ベクトルの時系列に変換する分析部1と、1つ以上のカテゴリを有し、各カテゴリに1つ以上の音響単位を有し、音声に現れるどのような音響単位の連鎖も受理可能であるような音響単位の接続関係を有する語彙非依存標準パタン3と、分析部1から得られた入力音声の特徴ベクトルの時系列と語彙非依存標準パタン3との間の対応付けを行ない、入力音声の特徴ベクトルと語彙非依存標準パタン3のカテゴリ毎の対応付け部分から入力音声および語彙非依存標準パタン3のカテゴリ毎の平均ベクトルを求める予備マッチング部2と、予備マッチング部2が算出したカテゴリ毎の平均ベクトルを用いて入力音声の特徴ベクトルの時系列もしくは語彙非依存標準パタンのどちから一方または両方に対して補正を行なう適応化部4とを有している。
請求項(抜粋):
入力音声を特徴ベクトルの時系列に変換する分析部と、1つ以上のカテゴリを有し、各カテゴリに1つ以上の音響単位を有し、音声に現れるどのような音響単位の連鎖も受理可能であるような音響単位の接続関係を有する語彙非依存標準パタンと、前記分析部から得られた入力音声の特徴ベクトルの時系列と前記語彙非依存標準パタンとの間の対応付けを行ない、前記入力音声の特徴ベクトルと前記語彙非依存標準パタンのカテゴリ毎の対応付け部分から入力音声および語彙非依存標準パタンのカテゴリ毎の平均ベクトルを求める予備マッチング部と、前記予備マッチング部が算出したカテゴリ毎の平均ベクトルを用いて前記入力音声の特徴ベクトルの時系列もしくは前記語彙非依存標準パタンのどちらか一方または両方に対して補正を行なう適応化部とで構成される音声適応化装置。
IPC (3件):
G10L 3/00 535 ,  G10L 3/00 531 ,  G10L 5/06

前のページに戻る