特許
J-GLOBAL ID:200903056334100473

発話識別装置および発話識別方法

発明者:
出願人/特許権者:
代理人 (1件): 佐藤 隆久
公報種別:公開公報
出願番号(国際出願番号):特願2004-138619
公開番号(公開出願番号):特開2005-321530
出願日: 2004年05月07日
公開日(公表日): 2005年11月17日
要約:
【課題】 事前に声紋などの特徴データを作成すること無しに、簡易な方法で、話者ごとに音声データを分離して・ファイル化することなどを可能とする発話識別装置および発話識別方法を提供する。 【解決手段】 音声データ群の特徴を抽出して特徴抽出音声データ(VP1 〜VPn )を生成し、特徴抽出音声データと音声データ(WA1 〜WAn )とを比較し、一致またはほぼ一致しているとき第1照合度を更新し、第1照合度が所定の値以上のとき同一音声データの集合に分類し、各集合に分類された強化された特徴抽出音声データ(+VP1 〜+VPn )を生成する。強化された特徴抽出音声データ(+VP1 〜+VPn )にラベルに対して音声データをクラスタリングして同じ特性を示す音声データごとに分類する。【選択図】 図4
請求項(抜粋):
複数の話者の連続的な音声データを、所定期間の音声データ群または所定量の音声データ群に分割する音声データ分割手段と、 上記分割した各音声データ群の特徴を抽出して特徴抽出音声データを生成する特徴抽出手段と、 上記生成された特徴抽出音声データと音声データとを比較し、または、上記生成された特徴抽出音声データと他の特徴抽出音声データとを比較し、一致またはほぼ一致しているとき第1照合度を更新し、該第1照合度が所定の値以上のとき同一音声データの集合に分類し、各集合に分類された強化された特徴抽出音声データを生成する、特徴抽出音声データ強化手段と、 上記生成された強化された特徴抽出音声データにラベルに対して音声データリストを生成し、音声データまたは特徴抽出音声データに対する比較データリストを生成し、上記音声データリスト内の強化された特徴抽出音声データと上記比較データリスト内のデータとを比較し、一致またはほぼ一致しているとき第2照合度を更新し、該第2照合度が一定値以上のとき、上記音声データを上記音声データリスト内に移動させる音声データ分析手段と を具備する、発話識別装置。
IPC (3件):
G10L17/00 ,  G10L15/02 ,  G10L15/22
FI (3件):
G10L3/00 545B ,  G10L3/00 515Z ,  G10L3/00 561C
Fターム (4件):
5D015AA03 ,  5D015CC01 ,  5D015CC05 ,  5D015LL05

前のページに戻る