特許
J-GLOBAL ID:200903052353855730
音声認識装置及び該装置の構文制御グラフの生成方法
発明者:
出願人/特許権者:
代理人 (1件):
高田 守 (外4名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-265278
公開番号(公開出願番号):特開平8-123472
出願日: 1994年10月28日
公開日(公表日): 1996年05月17日
要約:
【要約】【目的】 音声データとしてあり得ない3以上の長さの音韻列が認識されることを防止し、スペクトルの変動と音節内の音韻構造の変動をモデル化可能で、音韻境界の推定精度を改善した音声認識装置を提供することを目的とする。【構成】 テキストデータベースから音節構文グラフを抽出する過程と、音声データベースから音節内音韻グラフを抽出する過程と、音節構文グラフ中の枝に音節内音韻グラフを代入する過程によって、構文制御グラフとしての音韻構文グラフを生成する。この音韻構文グラフと、入力音声中の音韻境界の尤度情報に基づいて、音韻モデル間の遷移を制限して、入力音声を最適な音韻系列に変換する。
請求項(抜粋):
入力音声を分析し、前記入力音声を音韻モデルの連結と見なして、前記入力音声に音韻モデルの系列を当てはめ、前記入力音声を最適な音韻列に変換する音声認識装置において、前記入力音声から音韻の境界尤度を算出する境界尤度計算手段と、前記音韻の境界尤度が所定の値より大きく、かつ、音韻列中の長さ3以上の音韻の生起順序を規定する構文制御グラフに規定される音韻の生起順序に従う時に限り、最適な音韻モデルを選択するモデル演算手段とを備えたことを特徴とする音声認識装置。
IPC (3件):
G10L 3/00 531
, G10L 3/00 535
, G10L 3/00 561
引用特許:
審査官引用 (8件)
-
特開平4-172499
-
特開昭63-044697
-
特公平5-070838
全件表示
前のページに戻る