Pat
J-GLOBAL ID:201003017340424707

発話区間話者分類装置とその方法と、その装置を用いた音声認識装置とその方法と、プログラムと記録媒体

Inventor:
Applicant, Patent owner:
Agent (3): 中尾 直樹 ,  草野 卓 ,  中村 幸雄
Gazette classification:公開公報
Application number (International application number):2008195136
Publication number (International publication number):2010032792
Application date: Jul. 29, 2008
Publication date: Feb. 12, 2010
Summary:
【課題】事前の話者登録を無くす。【解決手段】この発明の発話区間話者分類装置は、音量音声区間分割部と、特徴量分析部と、代表特徴量抽出部と、セグメント分類部と、セグメント統合部と、を具備する。音量音声区間分割部は、離散値化された音声信号の音声区間検出を行い音声区間セグメントを出力する。特徴量分析部は、音声区間セグメントの音響特徴量分析を行い音響特徴量を出力する。代表特徴量抽出部は、音響特徴量から音声区間セグメントの代表特徴量を抽出する。セグメント分類部は、代表特徴量のそれぞれの間の距離を計算して距離に基づいて音声区間セグメントをクラスタに分類する。セグメント統合部は、隣接する上記音声区間セグメントが同一クラスタに属する場合に、隣接する音声区間セグメントを1個のセグメントとして統合する。 【選択図】図1
Claim (excerpt):
離散値化された音声信号の音声区間検出を行い音声区間セグメントを出力する音量音声区間分割部と、 上記音声区間セグメントの音響特徴量分析を行い音響特徴量を出力する特徴量分析部と、 上記音響特徴量から上記音声区間セグメントの代表特徴量を抽出する代表特徴量抽出部と、 上記音声区間セグメントについて、それぞれの上記代表特徴量間の距離を計算して上記距離に基づいて上記音声区間セグメントをクラスタに分類するセグメント分類部と、 隣接する上記音声区間セグメントが同一クラスタに属する場合に、隣接する上記音声区間セグメントを1個の音声セグメントとして統合するセグメント統合部と、 を具備する発話区間話者分類装置。
IPC (6):
G10L 17/00 ,  G10L 15/00 ,  G10L 15/04 ,  G10L 15/06 ,  G10L 11/00 ,  G10L 15/02
FI (8):
G10L17/00 200C ,  G10L15/00 200U ,  G10L15/04 300A ,  G10L15/06 500P ,  G10L11/00 402L ,  G10L15/02 200 ,  G10L15/04 300C ,  G10L15/06 310S
F-Term (1):
5D015AA03
Patent cited by the Patent:
Cited by applicant (1) Cited by examiner (10)
Show all

Return to Previous Page