抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
映画やテレビ番組などの映像コンテンツでは,吹替処理を施すことによって多言語化を実現している。一般に吹替処理では映像中の話者の口の動きに合わせて翻訳内容が考案される。しかし,これは翻訳家に大きな労力を強いる上,本来の意味と異なる台詞に翻訳される恐れがある。そこで,従来の吹替処理とは逆に,吹替音声に合わせて映像内の口形状を直接編集する「ビデオ翻訳」が提案されている。ビデオ翻訳を行う多くの既存手法では3D顔モデルが用いられるが,これらは首などの形状復元できない部位に適用できない問題がある。また結果映像はレンダリングやテクスチャマッピングの精度に依存するため,顔としての自然さに欠ける恐れがある。そこで本研究では自然な結果が得られる画像処理ベースのビデオ翻訳手法を提案する。入力には俳優と声優の2つの発話動画を用いる。俳優の動画フレームのうち声優口形状と最も類似するものを主成分分析を用いて選択し,フレーム間の時間連続性を考慮しつつ並び替える。これにより発話に伴う喉の動きまでを表現したビデオ翻訳映像を得ることができ,従来手法よりも自然な出力が可能になる。(著者抄録)