特許
J-GLOBAL ID:200903081206486045

学習音声パタンモデル使用音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 高田 守
公報種別:公開公報
出願番号(国際出願番号):特願平6-160153
公開番号(公開出願番号):特開平8-030289
出願日: 1994年07月12日
公開日(公表日): 1996年02月02日
要約:
【要約】【目的】 発話様式が大きく変動する音声に対しても高い音声認識ができる装置を得る。【構成】 音声の構成要素である音素や音節の音響特徴量を時系列表現した音声パタンモデルを学習により記憶する音声パタンモデル記憶手段と、この音声パタンモデルとして隣接音素と直接関連するコンテキスト依存音声パタンモデルの他に他のコンテキスト依存音声パタンモデルを持ち、これら音声パタンモデルのコンテキスト依存情報を保持する拡張異音テーブルと、拡張異音テーブルに保持されたコンテキスト依存情報に基づいて音声パタンモデルの学習用語彙と認識対象語彙の音声パタンモデルのネットワークを生成するネットワーク生成手段とを備え、ネットワーク生成手段で生成された音声パタンモデルのネットワークを用いて音声認識を行うようにした。
請求項(抜粋):
音声の構成要素である音素や音節の音響特徴量を時系列表現した音声パタンモデルを学習により記憶する音声パタンモデル記憶手段と、上記の音声パタンモデルとして隣接音素と直接関連するコンテキスト依存音声パタンモデルの他に、他のコンテキスト依存音声パタンモデルを持ち、該音声パタンモデルのコンテキスト依存情報を保持する拡張異音テーブルと、上記拡張異音テーブルに保持されたコンテキスト依存情報に基づいて音声パタンモデルの学習用語彙と認識対象語彙の音声パタンモデルのネットワークを生成するネットワーク生成手段とを備え、上記ネットワーク生成手段で生成された音声パタンモデルのネットワークを用いて音声認識を行う学習音声パタンモデル使用音声認識装置。
IPC (4件):
G10L 3/00 521 ,  G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 535
引用特許:
出願人引用 (6件)
  • 特公平7-072840
  • 特公平6-030095
  • 特開平2-113298
全件表示
審査官引用 (6件)
全件表示

前のページに戻る