文献
J-GLOBAL ID:201002270031219906   整理番号:10A0196270

AAMを用いた唇領域特徴による音声発話認識

Speech Recognition Based on Lip Area Feature Captured by AAM
著者 (4件):
資料名:
巻: 109  号: 376(MVE2009 79-129)  ページ: 357-362  発行年: 2010年01月14日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
雑音環境下で頑健に音声認識を行う手法の一つとして,音声情報に唇動画像情報を併用して認識を行うマルチモーダル音声認識が注目され,近年研究が進められている。マルチモーダル音声認識では音声情報のみでなく画像情報も大きな役割を果たすため,画像に対してどのような特徴量を用いるかが重要な論点となる。従来から音声特徴量はMFCCなどある程度定まった特徴量が用いられているのに対し,画像特徴量はその抽出法の違いから,さまざまな特徴量が提案されている。本研究ではActive Appearance Modelを用いることで唇領域を自動抽出し,座標値と輝度値の情報を含んだActive Appearance Modelのcombinedパラメータを用いて発話認識することにより,特徴量としての有効性を確認する。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る