特許
J-GLOBAL ID:200903053323200906

スピーチ合成方法

発明者:
出願人/特許権者:
代理人 (1件): 武石 靖彦 (外2名)
公報種別:公表公報
出願番号(国際出願番号):特願平10-544462
公開番号(公開出願番号):特表2001-517327
出願日: 1998年03月20日
公開日(公表日): 2001年10月02日
要約:
【要約】本発明は、スピーチ合成技術を介して、スピーチを割り当てられた人物の顔面運動を再現するスピーチ合成方法に関する。このスピーチは、データベースから取り出された多音字の集合からなっている。さらに、第1の人物の多音字に関連した顔面運動パターンを伴って、多音字を収容したデータバンクが確立される。第2の人物から得られた多音字はさらに、データベースに登録及び記憶される。データバンク及びデータベース中の対応する多音字における音声セグメントは、互いに比較され、それによってデータバンク中の顔面運動が、それらの偏差に従って変更される。変更された運動パターンは、データベース中にストアされるとともに、当該多音字に関連付けられる。登録された多音字は、その後、対応する運動パターンがデータベース中に運動パターンから取り出した顔面モデルを確立すると同時に、単語及び文章となるように集合させられる。
請求項(抜粋):
第1の人物から得られた第1の多音字及び関連する顔面運動がストアされ、 第2の人物から得られた第2の多音字がストアされるようにしたスピーチ合成 法であって、第1及び第2の多音字における音声セグメントの長さを比較し、 その場合において、顔面運動を第1及び第2の多音字間の関係に従って変更し 、その変更された顔面運動を伴うベースを生成し、さらに、その変更された顔 面運動を伴うベースを運動パターンと音声が対応するようにした付随音声を伴 う顔面モデルの生成に用いることを特徴とするスピーチ合成法。
IPC (4件):
G10L 13/06 ,  G06T 15/70 ,  G10L 13/00 ,  G10L 21/06
FI (3件):
G06T 15/70 B ,  G10L 5/04 F ,  G10L 3/00 S

前のページに戻る