スピーチ合成方法

発明者： ,
出願人/特許権者：
代理人 (1件)：武石靖彦 (外2名)
公報種別：公表公報
出願番号（国際出願番号）：特願平10-544462
公開番号（公開出願番号）：特表2001-517327
出願日： 1998年03月20日
公開日（公表日）： 2001年10月02日
要約：

【要約】本発明は、スピーチ合成技術を介して、スピーチを割り当てられた人物の顔面運動を再現するスピーチ合成方法に関する。このスピーチは、データベースから取り出された多音字の集合からなっている。さらに、第1の人物の多音字に関連した顔面運動パターンを伴って、多音字を収容したデータバンクが確立される。第2の人物から得られた多音字はさらに、データベースに登録及び記憶される。データバンク及びデータベース中の対応する多音字における音声セグメントは、互いに比較され、それによってデータバンク中の顔面運動が、それらの偏差に従って変更される。変更された運動パターンは、データベース中にストアされるとともに、当該多音字に関連付けられる。登録された多音字は、その後、対応する運動パターンがデータベース中に運動パターンから取り出した顔面モデルを確立すると同時に、単語及び文章となるように集合させられる。

請求項（抜粋）：

第1の人物から得られた第1の多音字及び関連する顔面運動がストアされ、第2の人物から得られた第2の多音字がストアされるようにしたスピーチ合成法であって、第1及び第2の多音字における音声セグメントの長さを比較し、その場合において、顔面運動を第1及び第2の多音字間の関係に従って変更し、その変更された顔面運動を伴うベースを生成し、さらに、その変更された顔面運動を伴うベースを運動パターンと音声が対応するようにした付随音声を伴う顔面モデルの生成に用いることを特徴とするスピーチ合成法。

IPC (4件)：

G10L 13/06 , G06T 15/70 , G10L 13/00 , G10L 21/06

FI (3件)：

G06T 15/70 B , G10L 5/04 F , G10L 3/00 S

前のページに戻る