特許
J-GLOBAL ID:200903048691594368

テキスト音声同期装置およびテキスト音声同期処理プログラム

発明者:
出願人/特許権者:
代理人 (5件): 鈴江 武彦 ,  河野 哲 ,  中村 誠 ,  村松 貞男 ,  橋本 良郎
公報種別:公開公報
出願番号(国際出願番号):特願2003-307305
公開番号(公開出願番号):特開2005-077678
出願日: 2003年08月29日
公開日(公表日): 2005年03月24日
要約:
【課題】テキスト音声同期装置であって、テキストデータと音声データとを高精度に同期再生するための関連付け情報を非常に簡単に作成すること。【解決手段】模範的な発声音声による語学学習文の音声入力を行うと、その発声音声が入力されるのに伴い、音声認識された音声波形および認識テキストがそれぞれ順次入力音声波形表示エリア45および認識テキスト表示エリア44に対応表示され、当該音声認識テキストを前記語学学習文の発声音声に対応する学習テキストとして容易に取得できると共に、その音声認識単語wn毎に音声入力の経過時間tnを記録したテキスト音声同期データを簡単に作成取得できる。そしてこのテキスト音声同期データ12eに基づき、学習テキストを各単語毎の発声速度(時間)に応じて順次識別表示させると共に、その発声音声を同期再生させるための同期再生用タイムコードファイルを非常に簡単に作成できる。【選択図】 図10
請求項(抜粋):
言語の発声に伴う音声を入力する音声入力手段と、 この音声入力手段により入力された発声音声をテキストとして認識する音声認識手段と、 この音声認識手段により認識されたテキストと前記音声入力手段により入力された発声音声の時間情報とを当該テキストの記述順番に対応付けた同期データとして取得する同期データ取得手段と、 を備えたことを特徴とするテキスト音声同期装置。
IPC (5件):
G10L15/22 ,  G09B15/00 ,  G10L13/00 ,  G10L15/00 ,  G10L15/28
FI (7件):
G10L3/00 561C ,  G09B15/00 Z ,  G10L3/00 551E ,  G10L3/00 551G ,  G10L3/00 571H ,  G10L3/00 551P ,  G10L3/00 R
Fターム (4件):
5D015KK02 ,  5D015LL05 ,  5D015LL11 ,  5D045AB13
引用特許:
出願人引用 (1件) 審査官引用 (7件)
全件表示

前のページに戻る