Pat
J-GLOBAL ID:200903079153865940

音声信号を分析する方法及びコンピュータ

Inventor:
Applicant, Patent owner:
Agent (1): 坂口 博 (外1名)
Gazette classification:公開公報
Application number (International application number):2000009623
Publication number (International publication number):2000259168
Application date: Jan. 19, 2000
Publication date: Sep. 22, 2000
Summary:
【要約】 (修正有)【課題】 情報検索、及び音声ストリームの概要確認、要点把握及び要約を目的に、音声ストリームを索引付けする方法及び装置を提供する。【解決手段】 音声ストリームを、それぞれがセグメントを含むインターバルに変換するステップを含む。インターバルの各セグメントについて、特定の0交差レート、特定のエネルギ及び特定のスペクトル・エネルギ濃度等の所定の音声フィーチャをセグメントが示すかどうかが判定される。沈黙、音楽、スピーチ及び音楽中のスピーチ等の音声イベントを表す音声フィーチャが発見的に求められ、また、インターバルのグループが、非割込み連続スピーチ、結論、スピーチの中の躊躇や強調等、発見的に定義されたメタ・パターンに一致するか否かが判定され、インターバル分類とメタ・パターン・マッチングをもとに音声ストリームに索引が付けられ、関連するフィーチャだけに索引が付けられ、情報処理の精度が改良される。
Claim (excerpt):
音声信号を分析するためにコンピュータにより実装する方法であって、前記音声信号の、それぞれがセグメントの時系列シーケンスを含むインターバルの中の音声イベントを検出するステップと、前記音声イベントを分析して、関連付けられた信頼度でスピーチ境界を識別するステップと、精度を改良するために、前記スピーチ境界と信頼度をもとに、発見的に求められた規則を用いて前記音声信号に索引を付けるステップと、再生を改良するために、前記音声信号の少なくとも1つの単語の代替単語に、関連付けられた重みと共に索引を付けるステップと、前記音声信号の索引を使用して、前記音声信号の単語スポッティング、要約及び概要確認等を行うステップと、を含む、方法。
IPC (6):
G10L 15/04 ,  G06F 3/16 320 ,  G06F 17/30 ,  G10L 15/08 ,  G10L 15/10 ,  G10L 15/00
FI (6):
G10L 3/00 515 C ,  G06F 3/16 320 H ,  G06F 15/40 370 E ,  G06F 15/401 310 C ,  G10L 3/00 531 W ,  G10L 3/00 551 G
Patent cited by the Patent:
Cited by examiner (10)
  • 映像分類方法および装置
    Gazette classification:公開公報   Application number:特願平8-340293   Applicant:日本電信電話株式会社
  • 特公平2-051303
  • 特公昭63-028527
Show all

Return to Previous Page