特許
J-GLOBAL ID:200903049281339308
音声認識による話者特徴判別方法
発明者:
,
出願人/特許権者:
代理人 (1件):
香山 秀幸
公報種別:公開公報
出願番号(国際出願番号):特願平8-210833
公開番号(公開出願番号):特開平10-055195
出願日: 1996年08月09日
公開日(公表日): 1998年02月24日
要約:
【要約】【課題】 不特定の話者が発声した音声に基づいて、話者の特徴を判別することができる音声認識による話者特徴判別方法を提供する。【解決手段】 話者の特徴が異なる多数の話者の音声をそれぞれ分析し、各分析結果に含まれている分析パラメータのうち音素の識別情報を多く含む分析パラメータのみを採用して、全ての分析結果を統計的に処理することにより、第1の音声認識モデルを作成し、各分析結果を上記第1の音声認識モデルを用いてセグメンテーションし、各分析結果の各フレームの分析パラメータと、上記第1の音声認識モデルのモデルパラメータとの対応関係をそれぞれ求め、各分析結果の各フレームの分析パラメータと上記第1の音声認識モデルのモデルパラメータとの対応関係、および対応付けられたフレームの分析パラメータのうち話者の特徴を表現しているパラメータに基づいて、話者の特徴ごとの第2の音声認識モデルを作成する。
請求項(抜粋):
学習処理と認識処理とからなり、学習処理は、話者の特徴が異なる多数の話者の音声をそれぞれ分析するステップ、各分析結果に含まれている分析パラメータのうち音素の識別情報を多く含む分析パラメータのみを採用して、全ての分析結果を統計的に処理することにより、第1の音声認識モデルを作成するステップ、各分析結果を上記第1の音声認識モデルを用いてセグメンテーションし、各分析結果の各フレームの分析パラメータと、上記第1の音声認識モデルのモデルパラメータとの対応関係をそれぞれ求めるステップ、ならびに各分析結果の各フレームの分析パラメータと上記第1の音声認識モデルのモデルパラメータとの対応関係、および対応付けられたフレームの分析パラメータのうち話者の特徴を表現しているパラメータに基づいて、話者の特徴ごとの第2の音声認識モデルを作成するステップを備え、認識処理は、認識対象音声データを分析するステップ、分析結果を上記第1の音声認識モデルを用いてセグメンテーションし、分析結果の各フレームの分析パラメータと、上記第1の音声認識モデルのモデルパラメータとの対応関係をそれぞれ求めるステップ、ならびに分析結果の各フレームの分析パラメータと上記第1の音声認識モデルのモデルパラメータとの対応関係と、話者の特徴ごとの上記第2の音声認識モデルとに基づいて、上記認識対象音声データに対する分析結果が、話者の特徴ごとの上記第2の音声認識モデルのうち、いずれのモデルに最も適合しているかを判定し、最も適合しているモデルに対応する話者の特徴を、上記認識対象音声データに対する話者の特徴とするステップを備えている音声認識による話者特徴判別方法。
IPC (2件):
G10L 3/00 535
, G10L 3/00 531
FI (2件):
G10L 3/00 535
, G10L 3/00 531 K
引用特許:
審査官引用 (6件)
-
特開昭61-180297
-
特開昭60-162298
-
特開昭60-129795
-
特開昭61-070594
-
特開昭61-048897
-
音声認識方法及び音声認識装置
公報種別:公開公報
出願番号:特願平6-050296
出願人:株式会社エイ・ティ・アール音声翻訳通信研究所
全件表示
前のページに戻る