特許
J-GLOBAL ID:200903002817177580

話速/画速同時変換システムおよび方法並びに話速/画速同時変換制御プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 谷 義一 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-249136
公開番号(公開出願番号):特開平11-088844
出願日: 1997年09月12日
公開日(公表日): 1999年03月30日
要約:
【要約】【課題】 不自然さや、ジッターを生じることなく、話速変換音声に同期(リップシンク)して、映像を可変速できるようにする。【解決手段】 話速変換部100は、区間分割部2で話速変換アルゴリズムに従って入力音声を無音区間、無声区間、有声区間に分割し、声の高さや個人性を保ちつつ、受聴者が話速設定部9で設定する話速倍率をもとに、無音区間延長部3、基本周期区間繰り返し部7により発話者の話速を受聴者の受聴能力に応じた速さに変換する。画速変換部200は、動きベクトル検出系により入力映像の動きベクトルを検出し、動きベクトルに応じて内挿を行なう変換アルゴリズムをべースに、話速変換部100の合成部8から転送される話速伸張・短縮コードをもとに、話速変換音声に同期して、適宜、可変時間長内で、任意の時間位置の映像(任意のフィールド数)を内挿することで、時々刻々、映像の速度を可変にする。
請求項(抜粋):
入力音声を受聴者により設定された話速倍率をもとに声の高さや個人性を保ちつつ伸張/短縮して話速変換音声として出力するとともに、話速変換を行なう可変長ブロック単位で該速変換音声が前記入力音声と比べてどの程度時間的な差が生じたかを検出する話速変換手段と、入力映像のフィールド間での動きベクトルを検出し、前記話速変換手段から転送される前記時間的な差が映像の単位フィールド時間を超えた場合、前記映像の動きベクトルをもとに前記時間的な差に相当する任意の時間位置のフィールドの内挿を行ない、あるいは動きの小さい映像については任意の時間位置のフィールドの直線内挿を行い、その結果を画速変換映像として出力する画速変換手段とを具備することを特徴とする話速/画速同時変換システム。
IPC (3件):
H04N 5/93 ,  G06T 1/00 ,  G10L 3/02
FI (3件):
H04N 5/93 G ,  G10L 3/02 A ,  G06F 15/62 420 A
引用特許:
出願人引用 (6件)
全件表示
審査官引用 (6件)
全件表示

前のページに戻る