Pat
J-GLOBAL ID:200903079153865940
音声信号を分析する方法及びコンピュータ
Inventor:
,
,
Applicant, Patent owner:
Agent (1):
坂口 博 (外1名)
Gazette classification:公開公報
Application number (International application number):2000009623
Publication number (International publication number):2000259168
Application date: Jan. 19, 2000
Publication date: Sep. 22, 2000
Summary:
【要約】 (修正有)【課題】 情報検索、及び音声ストリームの概要確認、要点把握及び要約を目的に、音声ストリームを索引付けする方法及び装置を提供する。【解決手段】 音声ストリームを、それぞれがセグメントを含むインターバルに変換するステップを含む。インターバルの各セグメントについて、特定の0交差レート、特定のエネルギ及び特定のスペクトル・エネルギ濃度等の所定の音声フィーチャをセグメントが示すかどうかが判定される。沈黙、音楽、スピーチ及び音楽中のスピーチ等の音声イベントを表す音声フィーチャが発見的に求められ、また、インターバルのグループが、非割込み連続スピーチ、結論、スピーチの中の躊躇や強調等、発見的に定義されたメタ・パターンに一致するか否かが判定され、インターバル分類とメタ・パターン・マッチングをもとに音声ストリームに索引が付けられ、関連するフィーチャだけに索引が付けられ、情報処理の精度が改良される。
Claim (excerpt):
音声信号を分析するためにコンピュータにより実装する方法であって、前記音声信号の、それぞれがセグメントの時系列シーケンスを含むインターバルの中の音声イベントを検出するステップと、前記音声イベントを分析して、関連付けられた信頼度でスピーチ境界を識別するステップと、精度を改良するために、前記スピーチ境界と信頼度をもとに、発見的に求められた規則を用いて前記音声信号に索引を付けるステップと、再生を改良するために、前記音声信号の少なくとも1つの単語の代替単語に、関連付けられた重みと共に索引を付けるステップと、前記音声信号の索引を使用して、前記音声信号の単語スポッティング、要約及び概要確認等を行うステップと、を含む、方法。
IPC (6):
G10L 15/04
, G06F 3/16 320
, G06F 17/30
, G10L 15/08
, G10L 15/10
, G10L 15/00
FI (6):
G10L 3/00 515 C
, G06F 3/16 320 H
, G06F 15/40 370 E
, G06F 15/401 310 C
, G10L 3/00 531 W
, G10L 3/00 551 G
Patent cited by the Patent:
Cited by examiner (10)
-
映像分類方法および装置
Gazette classification:公開公報
Application number:特願平8-340293
Applicant:日本電信電話株式会社
-
特公平2-051303
-
特公昭63-028527
-
音声情報の処理方法及びその装置
Gazette classification:公開公報
Application number:特願平6-192637
Applicant:富士通株式会社
-
オーディオ情報分類装置
Gazette classification:公開公報
Application number:特願平9-065595
Applicant:国際電信電話株式会社
-
聴取音自動選択装置
Gazette classification:公開公報
Application number:特願平8-049789
Applicant:富士通テン株式会社
-
音可視化方法および装置
Gazette classification:公開公報
Application number:特願平6-318122
Applicant:日本電信電話株式会社
-
音声・非音声判定方法
Gazette classification:公開公報
Application number:特願平6-153934
Applicant:松下電器産業株式会社
-
特許第3065314号
-
特開平3-080782
Show all
Return to Previous Page