文献
J-GLOBAL ID:201702266141117654   整理番号:17A1645018

畳込みニューラルネットワークを用いたマルチモーダル車両タイプ分類とMFCCの統計的表現【Powered by NICT】

Multimodal vehicle type classification using convolutional neural network and statistical representations of MFCC
著者 (2件):
資料名:
巻: 2017  号: AVSS  ページ: 1-6  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
実際生活交通シナリオにおける車両タイプの認識は,自動車と非制御環境の多様性のために困難な課題である。これらの課題に対処するために必要である効率的な方法と特徴表現。本論文では,実際の生活交通シナリオにおける車両タイプ分類問題に対処し,融合コンテキストにおけるオーディオビジュアル様式の効率的な表現を用いた多モード法を提案した。キーフレームと対応する音声フラグメントを抽出することにより,ビデオデータから分離した視聴覚モダリティを示した。ビデオデータの視覚・音声モダリティからの深層畳込みニューラルネットワーク(CNN)とメル周波数ケプストラム係数(MFCC)特徴を抽出した。主成分分析(PCA)アルゴリズムを視覚部分に使用され,MFCC特徴ベクトルの統計的表現の様々なタイプが代表的な特徴を選択するために計算した。これら表現は,溶融ロバストなマルチモーダル特徴を形成した。最後に,得られた多様な特徴を用いた車両タイプの最終的な分類のためのサポートベクトルマシン(SVM)分類器を訓練した。単一および多モードの場合TRECVID2012SINビデオ性能データセット上で提案手法の有効性を評価した。著者らの結果は,GoogLeNet CNN特徴を持つ提案したMFCC表現を融合分類精度を改善する示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 

前のページに戻る