特許
J-GLOBAL ID:200903092541900320
音声認識装置
発明者:
出願人/特許権者:
代理人 (1件):
澤田 俊夫
公報種別:公開公報
出願番号(国際出願番号):特願平8-086509
公開番号(公開出願番号):特開平9-274496
出願日: 1996年04月09日
公開日(公表日): 1997年10月21日
要約:
【要約】【課題】 正しい音節境界、文節境界を跨いで単語や文節の仮説が生成されないようにし、余分な計算量を極力抑え、また認識精度を向上させる【解決手段】 音響分析部10は入力音声信号を分析してLPC係数、ピッチ信号、パワー信号を生成する。 コード発生部13はLPC係数を受け取ってコード列を出力する。音節境界検出部15はLPC係数および音源パワー信号を受け取って音節の境界を検出する。文節境界検出部16はピッチ信号および音源パワー信号に基づいて文節の境界を検出する。有向グラフ作成部17はコード列を音節のHMMモデルに照合して有向グラフを生成する。有向グラフ作成部17はさらに音節および文節の境界位置検出信号に基づいて有向グラフのノードを確定する。
請求項(抜粋):
音声を音素、音節、単語などの認識単位の系列として認識し、その途中結果を有向グラフ型のデータ構造を用いて表現する際に、音声から特徴パラメータを抽出し、上記音素、音節、単語などの認識単位の境界点を検出し、その検出の確信度があらかじめ設定されている閾値より高い境界点を有向グラフのノードとして確定し、確定されたノードを跨ぐアークを無効化することを特徴とする音声認識装置。
IPC (4件):
G10L 3/00 531
, G10L 3/00 515
, G10L 3/00 561
, G10L 9/00 301
FI (4件):
G10L 3/00 531 D
, G10L 3/00 515 C
, G10L 3/00 561 G
, G10L 9/00 301 A
前のページに戻る