Pat
J-GLOBAL ID:200903075305849176
音声原稿最適照合装置および方法
Inventor:
Applicant, Patent owner:
Agent (1):
谷 義一 (外1名)
Gazette classification:公開公報
Application number (International application number):1997054448
Publication number (International publication number):1998254478
Application date: Mar. 10, 1997
Publication date: Sep. 25, 1998
Summary:
【要約】【課題】 ポーズが存在する音声と電子化原稿との時間的対応をとる。【解決手段】 当該ニュース項目に対応する電子化原稿を読み込み、ニュース項目の各文から、キーワード抽出部4によりキーワードを切り出し、各キーワードを音素記号列に変換する。音声キーワード照合部8によりキーワードモデルを構成する。ニュース項目に対応した音声を読み込み、音響分析部2により、音声中のポーズ区間を決定し、音声区間をそれぞれ音響パラメータに変換する。ついで、キーワードモデルを用いて、音声中からキーワード部分の候補を求め、得られたキーワード照合結果を、照合ラティスとして作成する。そして、照合ラティスの中から、最適照合列探索部10により、最適な照合列を探索し、探索された最適照合列に従って、各文の先頭に対応する音声の開始時間を出力し、この時間情報を用いて、音声と原稿の時間対応を求める。
Claim (excerpt):
複数単位の電子化原稿から単位ごとに各文の冒頭部分として予め定めた数の文節または単語を先頭から連続して取り出す冒頭部分取出手段と、該冒頭部分取出手段により取り出された各文の冒頭部分全体に対応する音響モデルを作成する音響モデル作成手段と、前記音声中のポーズ区間を検出するポーズ検出手段と、該ポーズ検出手段により検出されたポーズ区間とポーズ区間の間の音声区間をそれぞれ音響パラメータ列に変換する変換手段と、該変換手段により得られた各音声区間の音響パラメータ列と、前記音響モデル作成手段により作成された各文の冒頭部分全体の音響モデルとを照合し、照合結果を照合ラティスとして作成する照合手段と、該照合手段により作成された照合ラティスから最適照合列を探索する探索手段と、該探索手段により探索された最適照合列に従って、各文の先頭に対応する音声の開始時間を出力する出力手段とを備えたことを特徴とする音声原稿最適照合装置。
IPC (2):
G10L 3/00 531
, H04N 5/278
FI (2):
G10L 3/00 531 C
, H04N 5/278
Patent cited by the Patent:
Cited by examiner (1)
-
マルチメディアデータ作成支援装置
Gazette classification:公開公報
Application number:特願平7-017914
Applicant:日本電信電話株式会社
Return to Previous Page