特許
J-GLOBAL ID:200903081206486045
学習音声パタンモデル使用音声認識装置
発明者:
出願人/特許権者:
代理人 (1件):
高田 守
公報種別:公開公報
出願番号(国際出願番号):特願平6-160153
公開番号(公開出願番号):特開平8-030289
出願日: 1994年07月12日
公開日(公表日): 1996年02月02日
要約:
【要約】【目的】 発話様式が大きく変動する音声に対しても高い音声認識ができる装置を得る。【構成】 音声の構成要素である音素や音節の音響特徴量を時系列表現した音声パタンモデルを学習により記憶する音声パタンモデル記憶手段と、この音声パタンモデルとして隣接音素と直接関連するコンテキスト依存音声パタンモデルの他に他のコンテキスト依存音声パタンモデルを持ち、これら音声パタンモデルのコンテキスト依存情報を保持する拡張異音テーブルと、拡張異音テーブルに保持されたコンテキスト依存情報に基づいて音声パタンモデルの学習用語彙と認識対象語彙の音声パタンモデルのネットワークを生成するネットワーク生成手段とを備え、ネットワーク生成手段で生成された音声パタンモデルのネットワークを用いて音声認識を行うようにした。
請求項(抜粋):
音声の構成要素である音素や音節の音響特徴量を時系列表現した音声パタンモデルを学習により記憶する音声パタンモデル記憶手段と、上記の音声パタンモデルとして隣接音素と直接関連するコンテキスト依存音声パタンモデルの他に、他のコンテキスト依存音声パタンモデルを持ち、該音声パタンモデルのコンテキスト依存情報を保持する拡張異音テーブルと、上記拡張異音テーブルに保持されたコンテキスト依存情報に基づいて音声パタンモデルの学習用語彙と認識対象語彙の音声パタンモデルのネットワークを生成するネットワーク生成手段とを備え、上記ネットワーク生成手段で生成された音声パタンモデルのネットワークを用いて音声認識を行う学習音声パタンモデル使用音声認識装置。
IPC (4件):
G10L 3/00 521
, G10L 3/00 531
, G10L 3/00
, G10L 3/00 535
引用特許:
審査官引用 (6件)
-
音声モデルの構成方法及び音声認識装置
公報種別:公開公報
出願番号:特願平4-259301
出願人:日本アイ・ビー・エム株式会社
-
特公平6-030095
-
特開平2-113298
-
特開平4-227569
-
特開平2-029799
-
連続音声認識方式
公報種別:公開公報
出願番号:特願平4-027019
出願人:日本電気株式会社
全件表示
前のページに戻る