特許
J-GLOBAL ID:200903070829780589

発話区間識別装置及びその方法

発明者:
出願人/特許権者:
代理人 (4件): 蔦田 璋子 ,  蔦田 正人 ,  中村 哲士 ,  富田 克幸
公報種別:公開公報
出願番号(国際出願番号):特願2006-225905
公開番号(公開出願番号):特開2008-051907
出願日: 2006年08月22日
公開日(公表日): 2008年03月06日
要約:
【課題】話者交替箇所を迅速に検出する発話区間識別装置を提供する。【解決手段】音声データ取得部10、処理区間決定部20、処理区間格納部30、特徴量抽出部40、話者交替判定部50、話者交替判定結果格納部60、結果出力部70、発話時間ルール80から構成され、前回検出された話者交替箇所から単一話者によって最低限発声されている最小発話時間の2倍の時刻に対応する時刻にリターンポイントを設定し、前記リターンポイントから時間の逆方向に沿って今回の話者交替箇所を調査するための処理時刻を決定し、前記リターンポイントから時間と同じ方向に沿って次回の話者交替箇所を調査するための処理時刻を決定する。【選択図】 図1
請求項(抜粋):
複数の話者の発声が含まれる時系列の音声データを取得する音声データ取得部と、 前記音声データから特徴量を求める特徴量抽出部と、 所定の処理方向に沿って探索して検出された前回の話者交替箇所からさらに前記処理方向に沿って、単一話者によって発声されているとみなす最低限の時間である最小発話時間Mのa倍(但し、a>1である)のところの時刻に探索開始点を設定する探索開始点設定部と、 (1)前記探索開始点から次の話者交替箇所を探索するための探索方向を、前記処理方向、または、前記処理方向とは逆の逆処理方向であるかを決定し、(2)前記次の話者交替箇所が検出されたとき、または、前記検出を中止したときに、さらに次の話者交替箇所を探索するための探索方向を前記次の話者交替箇所を探索したときの探索方向とは逆の方向に決定する探索方向決定部と、 前記探索開始点から前記探索方向に沿って、前記特徴量に基づいて各時刻が話者交替箇所であるか否かを判断して、前記話者交替箇所を検出する話者交替箇所検出部と、を有したことを特徴とする発話区間識別装置。
IPC (2件):
G10L 15/04 ,  G10L 17/00
FI (3件):
G10L15/04 300Z ,  G10L15/04 300C ,  G10L17/00 200C
Fターム (2件):
5D015AA03 ,  5D015DD03
引用特許:
出願人引用 (2件)
  • 発言構造情報提示装置
    公報種別:公開公報   出願番号:特願平10-069124   出願人:富士ゼロックス株式会社
  • 特許第3350293号公報

前のページに戻る