文献
J-GLOBAL ID:201002239818361829   整理番号:10A0343371

時系列顔画像の動き特徴を用いた発声単語認識-特徴抽出の時間・空間的正規化条件の比較-

著者 (2件):
資料名:
巻: 250th  ページ: 19-37  発行年: 2010年03月23日 
JST資料番号: S0837A  ISSN: 0285-3957  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,発話時の顔の動画像から抽出される動き特徴を用いることによって,音情報によらずに発声単語の識別を行うシステムについて述べる。時系列画像の各画素における動きをOptical Flowの算出によって求め,これらから空間的な変化を表す速度特徴を抽出した。この速度特徴を用いて,発話の時間間隔を決定し,単語発声時の速度分布の時間的変化を表す高次元の特徴ベクトルを求めた。提案された特徴による発話単語認識に関する基本的な性能評価として,「ありがとう」「こんにちは」を含む発話5単語の識別実験を行い,良好な結果が得られた。また,口周辺だけでなくその他の領域の動き特徴を用いて識別を行った結果,発話単語認識は口周辺の動きだけに注目するより,顔全体の動きに注目した方がよいことがわかった。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 

前のページに戻る