特許
J-GLOBAL ID:200903048237395563
動画像とテキスト/音声変換器間の同期化システム
発明者:
,
,
出願人/特許権者:
代理人 (1件):
富田 和子 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-294278
公開番号(公開出願番号):特開平10-171486
出願日: 1997年10月27日
公開日(公表日): 1998年06月26日
要約:
【要約】【課題】TTS方式を利用して動画像にダビングをするのに、或いはアニメーションのような媒体及び合成音間の同期化を具現するのに必要な情報は、テキストから推定することが不可能である。このため、テキスト情報だけで動画像と自然に連動する合成音を作り出すことには多くの困難がある。【解決手段】同映像と音声信号間の同期化を具現できるように、唇の動く時刻と持続時間情報とを利用して合成音を生成することにより、動画像とテキスト/音声変換器との間の同期化を図る。
請求項(抜粋):
多重媒体情報の入力を受け付けて各々のデータ構造に変換して媒体別に分配する分配手段と、上記分配手段により分配された多重媒体情報のうちの映像情報の伝達を受け付ける映像出力手段と、上記分配手段により分配された多重媒体情報のうちの言語テキストの伝達を受け付ける言語処理手段と、上記言語処理手段が受け付けた言語テキストを、単語発音辞典と発音変換規則とを用いて音素列に変換し、この音素列を、構文構造情報を利用した韻律制御規則にしたがって、韻律情報である音素別持続時間、ピッチ値およびエネルギ値を推定する韻律処理手段と、上記韻律処理手段での処理結果である音素列および音素別持続時間にしたがい、音素別調音特性から唇形を推定して時間軸上に配列するとともに、音声と動画像との同期を図るため、これを上記分配手段により分配された多重媒体情報のうちの同期化情報である唇形を時間軸上に配列した結果と比較して、時間軸上で唇形の近似度が最も高い韻律処理結果である音素別持続時間を調整し、これを上記韻律処理手段の処理結果に包含して伝達する同期調整手段と、上記同期調整手段の処理結果を受けて、合成に必要なデータを各音素別に合成単位データベースから選択し、これを韻律情報である音素別持続時間、ピッチ値、エネルギ値に合わせて修正した後、合成フィルタを用いて合成音に変換して出力する信号処理手段と、上記信号処理手段の要求により、合成に必要な合成単位を選定した後、必要なデータを転送する合成単位データベースブロックと、を備えていることを特徴とする動画像とテキスト/音声変換器間の同期化システム。
IPC (3件):
G10L 3/00
, G10L 5/02
, G06F 17/28
FI (3件):
G10L 3/00 S
, G10L 5/02 J
, G06F 15/38 V
引用特許:
審査官引用 (4件)
-
特開平2-234285
-
特開平4-359299
-
動画像表示装置
公報種別:公開公報
出願番号:特願平5-135755
出願人:シャープ株式会社
-
表示制御装置
公報種別:公開公報
出願番号:特願平4-109357
出願人:ソニー株式会社
全件表示
前のページに戻る