Pat
J-GLOBAL ID:200903049281339308
音声認識による話者特徴判別方法
Inventor:
,
Applicant, Patent owner:
Agent (1):
香山 秀幸
Gazette classification:公開公報
Application number (International application number):1996210833
Publication number (International publication number):1998055195
Application date: Aug. 09, 1996
Publication date: Feb. 24, 1998
Summary:
【要約】【課題】 不特定の話者が発声した音声に基づいて、話者の特徴を判別することができる音声認識による話者特徴判別方法を提供する。【解決手段】 話者の特徴が異なる多数の話者の音声をそれぞれ分析し、各分析結果に含まれている分析パラメータのうち音素の識別情報を多く含む分析パラメータのみを採用して、全ての分析結果を統計的に処理することにより、第1の音声認識モデルを作成し、各分析結果を上記第1の音声認識モデルを用いてセグメンテーションし、各分析結果の各フレームの分析パラメータと、上記第1の音声認識モデルのモデルパラメータとの対応関係をそれぞれ求め、各分析結果の各フレームの分析パラメータと上記第1の音声認識モデルのモデルパラメータとの対応関係、および対応付けられたフレームの分析パラメータのうち話者の特徴を表現しているパラメータに基づいて、話者の特徴ごとの第2の音声認識モデルを作成する。
Claim (excerpt):
学習処理と認識処理とからなり、学習処理は、話者の特徴が異なる多数の話者の音声をそれぞれ分析するステップ、各分析結果に含まれている分析パラメータのうち音素の識別情報を多く含む分析パラメータのみを採用して、全ての分析結果を統計的に処理することにより、第1の音声認識モデルを作成するステップ、各分析結果を上記第1の音声認識モデルを用いてセグメンテーションし、各分析結果の各フレームの分析パラメータと、上記第1の音声認識モデルのモデルパラメータとの対応関係をそれぞれ求めるステップ、ならびに各分析結果の各フレームの分析パラメータと上記第1の音声認識モデルのモデルパラメータとの対応関係、および対応付けられたフレームの分析パラメータのうち話者の特徴を表現しているパラメータに基づいて、話者の特徴ごとの第2の音声認識モデルを作成するステップを備え、認識処理は、認識対象音声データを分析するステップ、分析結果を上記第1の音声認識モデルを用いてセグメンテーションし、分析結果の各フレームの分析パラメータと、上記第1の音声認識モデルのモデルパラメータとの対応関係をそれぞれ求めるステップ、ならびに分析結果の各フレームの分析パラメータと上記第1の音声認識モデルのモデルパラメータとの対応関係と、話者の特徴ごとの上記第2の音声認識モデルとに基づいて、上記認識対象音声データに対する分析結果が、話者の特徴ごとの上記第2の音声認識モデルのうち、いずれのモデルに最も適合しているかを判定し、最も適合しているモデルに対応する話者の特徴を、上記認識対象音声データに対する話者の特徴とするステップを備えている音声認識による話者特徴判別方法。
IPC (2):
G10L 3/00 535
, G10L 3/00 531
FI (2):
G10L 3/00 535
, G10L 3/00 531 K
Patent cited by the Patent:
Cited by examiner (6)
-
特開昭61-180297
-
特開昭60-162298
-
特開昭60-129795
-
特開昭61-070594
-
特開昭61-048897
-
音声認識方法及び音声認識装置
Gazette classification:公開公報
Application number:特願平6-050296
Applicant:株式会社エイ・ティ・アール音声翻訳通信研究所
Show all
Return to Previous Page