特許
J-GLOBAL ID:200903064368740059

句境界確率計算装置および句境界確率利用連続音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 吉田 研二 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-265668
公開番号(公開出願番号):特開平8-123469
出願日: 1994年10月28日
公開日(公表日): 1996年05月17日
要約:
【要約】【目的】 入力音声の各時刻における句境界確率を求め、句境界情報の音声認識への利用を容易にすることを目的としている。さらに、前記句境界確率を、音声認識のために利用して音声認識精度を改善することを目的としている。【構成】 入力音声のピッチ特徴量の時系列を算出するピッチ分析手段3と、アクセント句のピッチ特徴量の時系列をモデル化した1個または複数個のピッチパタンモデルを記憶するピッチパタンモデルメモリ7を備え、句境界確率計算手段9は、前記ピッチ特徴量の時系列とポーズ区間の開始時刻と終了時刻を入力とし、前記ピッチパタンモデルを用いて前記ピッチ特徴量の時系列に対するピッチ前向き確率とピッチ後ろ向き確率を計算し、このピッチ前向き確率とピッチ後ろ向き確率に基づいて前記入力音声の各時刻におけるアクセント句境界確率を計算する。
請求項(抜粋):
入力音声のピッチ特徴量の時系列を算出するピッチ分折手段と、アクセント句のピッチ特徴量の時系列をモデル化したl個または複数個のピッチパタンモデルを記憶したピッチパタンモデルメモリと、前記ピッチ特徴量の時系列を入力とし、前記ピッチパタンモデルの連鎖により前記ピッチ特徴量の時系列の初期から所定の時刻までのピッチ特徴量が出力される確率であるピッチ前向き確率と、前記ピッチパタンモデルの連鎖により前記ピッチ特徴量の時系列の終期から所定の時刻までのピッチ特徴量が出力される確率であるピッチ後ろ向き確率とを計算し、このピッチ前向き確率とピッチ後ろ向き確率とに基づいて、前記ピッチパタンモデルの連鎖により前記ピッチ特徴量の時系列が生成される全確率と、前記所定の時刻において前記ピッチパタンモデルの境界を通過して前記ピッチ特徴量の時系列が生成される確率との比により、前記入力音声の各時刻におけるアクセント句境界確率を計算する句境界確率計算手段と、を備えたことを特徴とする句境界確率計算装置。
IPC (5件):
G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 515 ,  G10L 3/00 521 ,  G10L 3/00 535

前のページに戻る