特許
J-GLOBAL ID:200903006606033358

話者検出方式および話者検出装置

発明者:
出願人/特許権者:
代理人 (1件): 武田 元敏
公報種別:公開公報
出願番号(国際出願番号):特願平4-320312
公開番号(公開出願番号):特開平6-167990
出願日: 1992年11月30日
公開日(公表日): 1994年06月14日
要約:
【要約】【目的】 複数の話者の発声した音声の中からある特定の話者の音声のみを判別する話者検出方式および話者検出装置に関するもので、簡単な構成で自動的にしかも高精度な話者検出が可能な話者検出装置を実現すること。【構成】 マイクロフォンの入力信号か一定時間毎に音声中の特徴量を抽出する特徴抽出部11と、検出したい話者の多数の学習用音声データからコードブックを作成するコードブック作成部12と、特徴抽出部で抽出した特徴量をコードブック作成部にて作成したコードブックによりベクトル量子化した際の量子化歪を計算するベクトル量子化部13と、検出しようとするフレームとその前後数フレームにおいて計算された量子化歪から求められるフレーム平均歪みからどのコードワードに対応するかを判定するコード検出部14と、検出されたコードワード列の総歪量とある適当な閾値とを比較することで、ある一人の話者の発声した音声のみを検出する話者判定部15を備えた構成を有する。
請求項(抜粋):
マイクロフォンを使用した収音システムにおいて、マイクロフォンの入力信号から一定時間(フレーム)毎に音声中の音韻性を特徴付ける特徴量を抽出し、前記特徴量の時間的あるいは周波数的な性質から、複数の話者から発声される音声信号のうち、ある一人の話者の発声した音声のみを検出する話者検出方式。
IPC (4件):
G10L 3/00 513 ,  G10L 3/00 515 ,  G10L 3/00 531 ,  G10L 9/18

前のページに戻る