文献
J-GLOBAL ID:201602281889677067   整理番号:16A0617780

視覚音声認識のための深い相補的ボトルネック特徴【Powered by NICT】

Deep complementary bottleneck features for visual speech recognition
著者 (2件):
資料名:
巻: 2016  号: ICASSP  ページ: 2304-2308  発行年: 2016年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ディープボトルネック特徴(DBNFs)は,音声からの音響音声認識のための過去に成功裏に使用されている。しかし,視覚音声認識のためのDBNFs抽出に関する研究は非常に限られている。本研究では,深いオートエンコーダに基づく深ボトルネック視覚特徴を抽出する方法を提案した。著者らの知識の及ぶ限りでは,これはピクセルから視覚音声認識のためのDBNFsを抽出する最初の研究である。画像の次元性を低減するために,著者らは最初に,ボトルネック層を持つ深いオートエンコーダを訓練した。オートエンコーダの復号化層は,ボトルネック特徴はよりおおきな判別する分類層により置換された。DCT特徴に相補的なボトルネック特徴を作成するために離散余弦変換(DCT)特徴を訓練中のボトルネック層においても付した[1995.3]。買い-売り記憶(LSTM)ネットワークは,時間的動力学をモデル化するために使用し,性能はOuluVSとAVLettersデータベース上で評価した。DCT特徴との組合せの中で抽出された相補的DBNFはDCTベースラインで5%までの絶対改善した最良の性能を達成した。Copyright 2016 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る