特許
J-GLOBAL ID:200903043221532461
テキスト音声同期装置およびテキスト音声同期処理プログラム
発明者:
,
,
出願人/特許権者:
代理人 (5件):
鈴江 武彦
, 河野 哲
, 中村 誠
, 村松 貞男
, 橋本 良郎
公報種別:公開公報
出願番号(国際出願番号):特願2003-303092
公開番号(公開出願番号):特開2005-070645
出願日: 2003年08月27日
公開日(公表日): 2005年03月17日
要約:
【課題】テキスト音声同期装置であって、テキストデータと音声データとを高精度に同期再生するための関連付け情報を容易に生成すること。【解決手段】テキスト/音声同期付け画面G1の模範テキスト表示エリア44に表示される模範学習データのテキストデータに従って、当該模範テキストの模範的読み上げを行うと、その読み上げ音声入力と共に音声認識された音声波形および認識テキストがそれぞれ順次入力音声波形表示エリア47および認識テキスト表示エリア46に対応表示され、読み上げ音声認識単語毎にその読み上げ経過時間を記録したテキスト音声同期データが取得される。この際、模範テキストと読み上げ音声の認識テキストとが比較され、当該読み上げ音声に模範テキストに対する差異が生じているか判断され、認識テキスト表示エリア46上の差異抽出部分において当該差異の種類に応じた識別表示が行われる。【選択図】 図6
請求項(抜粋):
テキストを記憶するテキスト記憶手段と、
このテキスト記憶手段により記憶されたテキストを表示する第1のテキスト表示手段と、
この第1のテキスト表示手段により表示されたテキストについて、当該テキストの読み上げに伴う音声を入力する音声入力手段と、
この音声入力手段により入力された読み上げ音声をテキストとして認識する音声認識手段と、
この音声認識手段により認識された読み上げ音声の認識テキストを表示する第2のテキスト表示手段と、
前記第1のテキスト表示手段により表示されたテキストに対し前記音声認識手段により認識された読み上げ音声の認識テキストを比較してその差異を抽出する差異抽出手段と、
この差異抽出手段により抽出された読み上げ音声認識テキストの差異抽出部分を前記第2のテキスト表示手段により表示される読み上げ音声の認識テキスト上で報知する差異報知手段と、
前記テキスト記憶手段により記憶されたテキストと前記音声入力手段により入力された読み上げ音声の読み上げ時間情報とを当該テキストの記述順番に対応付けた同期データとして取得する同期データ取得手段と、
を備えたことを特徴とするテキスト音声同期装置。
IPC (5件):
G10L15/22
, G06F3/16
, G10K15/04
, G10L15/00
, H04N5/278
FI (6件):
G10L3/00 561C
, G06F3/16 320D
, G10K15/04 302D
, H04N5/278
, G10L3/00 551B
, G10L3/00 551G
Fターム (11件):
5C023AA18
, 5C023AA38
, 5C023BA11
, 5C023CA05
, 5C023DA04
, 5C023DA08
, 5D015AA01
, 5D015LL05
, 5D015LL13
, 5D108BD13
, 5D108BD14
引用特許:
出願人引用 (1件)
-
字幕送出タイミング検出装置
公報種別:公開公報
出願番号:特願2001-038918
出願人:通信・放送機構, 三菱電機株式会社, 日本放送協会
審査官引用 (10件)
-
特開平4-311989
-
発声訓練装置
公報種別:公開公報
出願番号:特願平5-330439
出願人:日本電気株式会社
-
時系列データ記録再生装置
公報種別:公開公報
出願番号:特願平5-325231
出願人:株式会社東芝, 東芝ソフトウェアエンジニアリング株式会社
全件表示
前のページに戻る