Pat
J-GLOBAL ID:200903006606033358

話者検出方式および話者検出装置

Inventor:
Applicant, Patent owner:
Agent (1): 武田 元敏
Gazette classification:公開公報
Application number (International application number):1992320312
Publication number (International publication number):1994167990
Application date: Nov. 30, 1992
Publication date: Jun. 14, 1994
Summary:
【要約】【目的】 複数の話者の発声した音声の中からある特定の話者の音声のみを判別する話者検出方式および話者検出装置に関するもので、簡単な構成で自動的にしかも高精度な話者検出が可能な話者検出装置を実現すること。【構成】 マイクロフォンの入力信号か一定時間毎に音声中の特徴量を抽出する特徴抽出部11と、検出したい話者の多数の学習用音声データからコードブックを作成するコードブック作成部12と、特徴抽出部で抽出した特徴量をコードブック作成部にて作成したコードブックによりベクトル量子化した際の量子化歪を計算するベクトル量子化部13と、検出しようとするフレームとその前後数フレームにおいて計算された量子化歪から求められるフレーム平均歪みからどのコードワードに対応するかを判定するコード検出部14と、検出されたコードワード列の総歪量とある適当な閾値とを比較することで、ある一人の話者の発声した音声のみを検出する話者判定部15を備えた構成を有する。
Claim (excerpt):
マイクロフォンを使用した収音システムにおいて、マイクロフォンの入力信号から一定時間(フレーム)毎に音声中の音韻性を特徴付ける特徴量を抽出し、前記特徴量の時間的あるいは周波数的な性質から、複数の話者から発声される音声信号のうち、ある一人の話者の発声した音声のみを検出する話者検出方式。
IPC (4):
G10L 3/00 513 ,  G10L 3/00 515 ,  G10L 3/00 531 ,  G10L 9/18

Return to Previous Page