特許
J-GLOBAL ID:200903079153865940
音声信号を分析する方法及びコンピュータ
発明者:
,
,
出願人/特許権者:
代理人 (1件):
坂口 博 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-009623
公開番号(公開出願番号):特開2000-259168
出願日: 2000年01月19日
公開日(公表日): 2000年09月22日
要約:
【要約】 (修正有)【課題】 情報検索、及び音声ストリームの概要確認、要点把握及び要約を目的に、音声ストリームを索引付けする方法及び装置を提供する。【解決手段】 音声ストリームを、それぞれがセグメントを含むインターバルに変換するステップを含む。インターバルの各セグメントについて、特定の0交差レート、特定のエネルギ及び特定のスペクトル・エネルギ濃度等の所定の音声フィーチャをセグメントが示すかどうかが判定される。沈黙、音楽、スピーチ及び音楽中のスピーチ等の音声イベントを表す音声フィーチャが発見的に求められ、また、インターバルのグループが、非割込み連続スピーチ、結論、スピーチの中の躊躇や強調等、発見的に定義されたメタ・パターンに一致するか否かが判定され、インターバル分類とメタ・パターン・マッチングをもとに音声ストリームに索引が付けられ、関連するフィーチャだけに索引が付けられ、情報処理の精度が改良される。
請求項(抜粋):
音声信号を分析するためにコンピュータにより実装する方法であって、前記音声信号の、それぞれがセグメントの時系列シーケンスを含むインターバルの中の音声イベントを検出するステップと、前記音声イベントを分析して、関連付けられた信頼度でスピーチ境界を識別するステップと、精度を改良するために、前記スピーチ境界と信頼度をもとに、発見的に求められた規則を用いて前記音声信号に索引を付けるステップと、再生を改良するために、前記音声信号の少なくとも1つの単語の代替単語に、関連付けられた重みと共に索引を付けるステップと、前記音声信号の索引を使用して、前記音声信号の単語スポッティング、要約及び概要確認等を行うステップと、を含む、方法。
IPC (6件):
G10L 15/04
, G06F 3/16 320
, G06F 17/30
, G10L 15/08
, G10L 15/10
, G10L 15/00
FI (6件):
G10L 3/00 515 C
, G06F 3/16 320 H
, G06F 15/40 370 E
, G06F 15/401 310 C
, G10L 3/00 531 W
, G10L 3/00 551 G
引用特許:
審査官引用 (10件)
-
映像分類方法および装置
公報種別:公開公報
出願番号:特願平8-340293
出願人:日本電信電話株式会社
-
特公平2-051303
-
特公昭63-028527
-
音声情報の処理方法及びその装置
公報種別:公開公報
出願番号:特願平6-192637
出願人:富士通株式会社
-
オーディオ情報分類装置
公報種別:公開公報
出願番号:特願平9-065595
出願人:国際電信電話株式会社
-
聴取音自動選択装置
公報種別:公開公報
出願番号:特願平8-049789
出願人:富士通テン株式会社
-
音可視化方法および装置
公報種別:公開公報
出願番号:特願平6-318122
出願人:日本電信電話株式会社
-
音声・非音声判定方法
公報種別:公開公報
出願番号:特願平6-153934
出願人:松下電器産業株式会社
-
特許第3065314号
-
特開平3-080782
全件表示
前のページに戻る