特許
J-GLOBAL ID:200903079153865940

音声信号を分析する方法及びコンピュータ

発明者:
出願人/特許権者:
代理人 (1件): 坂口 博 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-009623
公開番号(公開出願番号):特開2000-259168
出願日: 2000年01月19日
公開日(公表日): 2000年09月22日
要約:
【要約】 (修正有)【課題】 情報検索、及び音声ストリームの概要確認、要点把握及び要約を目的に、音声ストリームを索引付けする方法及び装置を提供する。【解決手段】 音声ストリームを、それぞれがセグメントを含むインターバルに変換するステップを含む。インターバルの各セグメントについて、特定の0交差レート、特定のエネルギ及び特定のスペクトル・エネルギ濃度等の所定の音声フィーチャをセグメントが示すかどうかが判定される。沈黙、音楽、スピーチ及び音楽中のスピーチ等の音声イベントを表す音声フィーチャが発見的に求められ、また、インターバルのグループが、非割込み連続スピーチ、結論、スピーチの中の躊躇や強調等、発見的に定義されたメタ・パターンに一致するか否かが判定され、インターバル分類とメタ・パターン・マッチングをもとに音声ストリームに索引が付けられ、関連するフィーチャだけに索引が付けられ、情報処理の精度が改良される。
請求項(抜粋):
音声信号を分析するためにコンピュータにより実装する方法であって、前記音声信号の、それぞれがセグメントの時系列シーケンスを含むインターバルの中の音声イベントを検出するステップと、前記音声イベントを分析して、関連付けられた信頼度でスピーチ境界を識別するステップと、精度を改良するために、前記スピーチ境界と信頼度をもとに、発見的に求められた規則を用いて前記音声信号に索引を付けるステップと、再生を改良するために、前記音声信号の少なくとも1つの単語の代替単語に、関連付けられた重みと共に索引を付けるステップと、前記音声信号の索引を使用して、前記音声信号の単語スポッティング、要約及び概要確認等を行うステップと、を含む、方法。
IPC (6件):
G10L 15/04 ,  G06F 3/16 320 ,  G06F 17/30 ,  G10L 15/08 ,  G10L 15/10 ,  G10L 15/00
FI (6件):
G10L 3/00 515 C ,  G06F 3/16 320 H ,  G06F 15/40 370 E ,  G06F 15/401 310 C ,  G10L 3/00 531 W ,  G10L 3/00 551 G
引用特許:
審査官引用 (10件)
全件表示

前のページに戻る