特許
J-GLOBAL ID:200903030119533971

ワードスポッティング法

発明者:
出願人/特許権者:
代理人 (1件): 中村 稔 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-244401
公開番号(公開出願番号):特開平5-204394
出願日: 1992年09月14日
公開日(公表日): 1993年08月13日
要約:
【要約】【目的】 音声編集または索引付けの目的で、前に録音された音声の中の同じ話者または別の話者が話したキーワードを見つけ出す方法を提供する。【構成】 本方法は、隠れマルコフモデル(HMM)に基づいており、話者が動的にキーワードを指定し、キーワードの1回の繰り返しでHMMを訓練することができる。連続する音声の前に録音されたサンプルから得た訓練されたHMMを使用して、非キーワード音声をモデル化する。【効果】ワードスポッティング装置は音声メールやマルチメディアドキュメントの編集などの対話型応用や、1人の話者のオーディオまたはビデオ録音におけるキーワード索引付けに使用することができる。
請求項(抜粋):
1回話されたキーワードを用いて、録音された発声の中のキーワードを見つけ出す方法であって、録音された発声の声の特徴を表す第1モデルを作るステップ、キーワードを1回だけ話すステップ、見つけ出す前記キーワードの特徴を表す第2モデルを作るステップ、発声を入力し、キーワードのエンド状態の事後確率のピークを探し出すステップ、前記ピークを探し出すステップにおいて、もしピークが見つかれば、発声の終わりまで後戻りして、キーワードについてスコアを計算するステップ、および前記スコアが所定のしきい値を越えたら、発声の中のキーワードが見つかったことを指示するステップ、から成ることを特徴とする方法。

前のページに戻る