特許
J-GLOBAL ID:200903005121620186
映像を用いた発音の推定方法
発明者:
,
出願人/特許権者:
代理人 (1件):
河▲崎▼ 眞樹
公報種別:公開公報
出願番号(国際出願番号):特願2006-331291
公開番号(公開出願番号):特開2008-146268
出願日: 2006年12月08日
公開日(公表日): 2008年06月26日
要約:
【課題】ヒトの映像を用いることにより、周囲の雑音等に左右されることなく、発言者の発音および発言内容を推定する方法を提供する。【解決手段】ヒトの顔の映像を用いて、口唇の輪郭形状を所定の単位時間毎に計測し、その形状の特徴を、フーリエ記述子法により有限個のフーリエ記述子として定量化し、これらの値を記録した後、所定のフーリエ記述子のデータを用いて、その値の変化により該ヒトの発音の開始点および終了点を判定するとともに、これら開始点から終了点までの間における前記所定のフーリエ記述子を含む複数個のフーリエ記述子のデータを用いて、回帰計算により近似のn次多項式を算出し、これらのフーリエ記述子の個々について、n+1個の係数を取得してから、これら各係数と、母音および子音ごとにあらかじめ定めておいた各係数の標準値とを、線形判別関数を用いて比較することにより、前記ヒトが発言した文字を推定する。【選択図】図1
請求項(抜粋):
ヒトの顔の映像を用いて、口唇の輪郭形状を所定の単位時間毎に計測し、その形状の特徴を、フーリエ記述子法により有限個のフーリエ記述子として定量化し、これらの値を記録した後、
所定のフーリエ記述子のデータを用いて、その値の変化により該ヒトの発音の開始点および終了点を判定するとともに、
これら開始点から終了点までの間における前記所定のフーリエ記述子を含む複数個のフーリエ記述子のデータを用いて、回帰計算により近似のn次多項式を算出し、これらのフーリエ記述子の個々について、n+1個の係数を取得してから、
これら各係数と、母音および子音ごとにあらかじめ定めておいた各係数の標準値とを、線形判別関数を用いて比較することにより、前記ヒトが発言した文字を推定することを特徴とする発音の推定方法。
IPC (2件):
FI (2件):
G06T7/20 300B
, G10L15/24 Q
Fターム (6件):
5D015LL07
, 5L096CA04
, 5L096FA06
, 5L096FA23
, 5L096HA02
, 5L096JA11
前のページに戻る