特許
J-GLOBAL ID:200903075305849176

音声原稿最適照合装置および方法

発明者:
出願人/特許権者:
代理人 (1件): 谷 義一 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-054448
公開番号(公開出願番号):特開平10-254478
出願日: 1997年03月10日
公開日(公表日): 1998年09月25日
要約:
【要約】【課題】 ポーズが存在する音声と電子化原稿との時間的対応をとる。【解決手段】 当該ニュース項目に対応する電子化原稿を読み込み、ニュース項目の各文から、キーワード抽出部4によりキーワードを切り出し、各キーワードを音素記号列に変換する。音声キーワード照合部8によりキーワードモデルを構成する。ニュース項目に対応した音声を読み込み、音響分析部2により、音声中のポーズ区間を決定し、音声区間をそれぞれ音響パラメータに変換する。ついで、キーワードモデルを用いて、音声中からキーワード部分の候補を求め、得られたキーワード照合結果を、照合ラティスとして作成する。そして、照合ラティスの中から、最適照合列探索部10により、最適な照合列を探索し、探索された最適照合列に従って、各文の先頭に対応する音声の開始時間を出力し、この時間情報を用いて、音声と原稿の時間対応を求める。
請求項(抜粋):
複数単位の電子化原稿から単位ごとに各文の冒頭部分として予め定めた数の文節または単語を先頭から連続して取り出す冒頭部分取出手段と、該冒頭部分取出手段により取り出された各文の冒頭部分全体に対応する音響モデルを作成する音響モデル作成手段と、前記音声中のポーズ区間を検出するポーズ検出手段と、該ポーズ検出手段により検出されたポーズ区間とポーズ区間の間の音声区間をそれぞれ音響パラメータ列に変換する変換手段と、該変換手段により得られた各音声区間の音響パラメータ列と、前記音響モデル作成手段により作成された各文の冒頭部分全体の音響モデルとを照合し、照合結果を照合ラティスとして作成する照合手段と、該照合手段により作成された照合ラティスから最適照合列を探索する探索手段と、該探索手段により探索された最適照合列に従って、各文の先頭に対応する音声の開始時間を出力する出力手段とを備えたことを特徴とする音声原稿最適照合装置。
IPC (2件):
G10L 3/00 531 ,  H04N 5/278
FI (2件):
G10L 3/00 531 C ,  H04N 5/278
引用特許:
審査官引用 (1件)

前のページに戻る