特許
J-GLOBAL ID:201003017340424707

発話区間話者分類装置とその方法と、その装置を用いた音声認識装置とその方法と、プログラムと記録媒体

発明者:
出願人/特許権者:
代理人 (3件): 中尾 直樹 ,  草野 卓 ,  中村 幸雄
公報種別:公開公報
出願番号(国際出願番号):特願2008-195136
公開番号(公開出願番号):特開2010-032792
出願日: 2008年07月29日
公開日(公表日): 2010年02月12日
要約:
【課題】事前の話者登録を無くす。【解決手段】この発明の発話区間話者分類装置は、音量音声区間分割部と、特徴量分析部と、代表特徴量抽出部と、セグメント分類部と、セグメント統合部と、を具備する。音量音声区間分割部は、離散値化された音声信号の音声区間検出を行い音声区間セグメントを出力する。特徴量分析部は、音声区間セグメントの音響特徴量分析を行い音響特徴量を出力する。代表特徴量抽出部は、音響特徴量から音声区間セグメントの代表特徴量を抽出する。セグメント分類部は、代表特徴量のそれぞれの間の距離を計算して距離に基づいて音声区間セグメントをクラスタに分類する。セグメント統合部は、隣接する上記音声区間セグメントが同一クラスタに属する場合に、隣接する音声区間セグメントを1個のセグメントとして統合する。 【選択図】図1
請求項(抜粋):
離散値化された音声信号の音声区間検出を行い音声区間セグメントを出力する音量音声区間分割部と、 上記音声区間セグメントの音響特徴量分析を行い音響特徴量を出力する特徴量分析部と、 上記音響特徴量から上記音声区間セグメントの代表特徴量を抽出する代表特徴量抽出部と、 上記音声区間セグメントについて、それぞれの上記代表特徴量間の距離を計算して上記距離に基づいて上記音声区間セグメントをクラスタに分類するセグメント分類部と、 隣接する上記音声区間セグメントが同一クラスタに属する場合に、隣接する上記音声区間セグメントを1個の音声セグメントとして統合するセグメント統合部と、 を具備する発話区間話者分類装置。
IPC (6件):
G10L 17/00 ,  G10L 15/00 ,  G10L 15/04 ,  G10L 15/06 ,  G10L 11/00 ,  G10L 15/02
FI (8件):
G10L17/00 200C ,  G10L15/00 200U ,  G10L15/04 300A ,  G10L15/06 500P ,  G10L11/00 402L ,  G10L15/02 200 ,  G10L15/04 300C ,  G10L15/06 310S
Fターム (1件):
5D015AA03
引用特許:
出願人引用 (11件)
全件表示
審査官引用 (10件)
全件表示

前のページに戻る