Pat
J-GLOBAL ID:200903043221532461

テキスト音声同期装置およびテキスト音声同期処理プログラム

Inventor:
Applicant, Patent owner:
Agent (5): 鈴江 武彦 ,  河野 哲 ,  中村 誠 ,  村松 貞男 ,  橋本 良郎
Gazette classification:公開公報
Application number (International application number):2003303092
Publication number (International publication number):2005070645
Application date: Aug. 27, 2003
Publication date: Mar. 17, 2005
Summary:
【課題】テキスト音声同期装置であって、テキストデータと音声データとを高精度に同期再生するための関連付け情報を容易に生成すること。【解決手段】テキスト/音声同期付け画面G1の模範テキスト表示エリア44に表示される模範学習データのテキストデータに従って、当該模範テキストの模範的読み上げを行うと、その読み上げ音声入力と共に音声認識された音声波形および認識テキストがそれぞれ順次入力音声波形表示エリア47および認識テキスト表示エリア46に対応表示され、読み上げ音声認識単語毎にその読み上げ経過時間を記録したテキスト音声同期データが取得される。この際、模範テキストと読み上げ音声の認識テキストとが比較され、当該読み上げ音声に模範テキストに対する差異が生じているか判断され、認識テキスト表示エリア46上の差異抽出部分において当該差異の種類に応じた識別表示が行われる。【選択図】 図6
Claim (excerpt):
テキストを記憶するテキスト記憶手段と、 このテキスト記憶手段により記憶されたテキストを表示する第1のテキスト表示手段と、 この第1のテキスト表示手段により表示されたテキストについて、当該テキストの読み上げに伴う音声を入力する音声入力手段と、 この音声入力手段により入力された読み上げ音声をテキストとして認識する音声認識手段と、 この音声認識手段により認識された読み上げ音声の認識テキストを表示する第2のテキスト表示手段と、 前記第1のテキスト表示手段により表示されたテキストに対し前記音声認識手段により認識された読み上げ音声の認識テキストを比較してその差異を抽出する差異抽出手段と、 この差異抽出手段により抽出された読み上げ音声認識テキストの差異抽出部分を前記第2のテキスト表示手段により表示される読み上げ音声の認識テキスト上で報知する差異報知手段と、 前記テキスト記憶手段により記憶されたテキストと前記音声入力手段により入力された読み上げ音声の読み上げ時間情報とを当該テキストの記述順番に対応付けた同期データとして取得する同期データ取得手段と、 を備えたことを特徴とするテキスト音声同期装置。
IPC (5):
G10L15/22 ,  G06F3/16 ,  G10K15/04 ,  G10L15/00 ,  H04N5/278
FI (6):
G10L3/00 561C ,  G06F3/16 320D ,  G10K15/04 302D ,  H04N5/278 ,  G10L3/00 551B ,  G10L3/00 551G
F-Term (11):
5C023AA18 ,  5C023AA38 ,  5C023BA11 ,  5C023CA05 ,  5C023DA04 ,  5C023DA08 ,  5D015AA01 ,  5D015LL05 ,  5D015LL13 ,  5D108BD13 ,  5D108BD14
Patent cited by the Patent:
Cited by applicant (1)
  • 字幕送出タイミング検出装置
    Gazette classification:公開公報   Application number:特願2001-038918   Applicant:通信・放送機構, 三菱電機株式会社, 日本放送協会
Cited by examiner (10)
Show all

Return to Previous Page