畳込みニューラルネットワークを用いたマルチモーダル車両タイプ分類とMFCCの統計的表現【Powered by NICT】

Selbes Berkay; Sert Mustafa

文献

J-GLOBAL ID：201702266141117654 整理番号：17A1645018

畳込みニューラルネットワークを用いたマルチモーダル車両タイプ分類とMFCCの統計的表現【Powered by NICT】

Multimodal vehicle type classification using convolutional neural network and statistical representations of MFCC

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A1645018&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A1645018&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (2件)： ,
資料名：
巻： 2017 号： AVSS ページ： 1-6 発行年： 2017年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

実際生活交通シナリオにおける車両タイプの認識は,自動車と非制御環境の多様性のために困難な課題である。これらの課題に対処するために必要である効率的な方法と特徴表現。本論文では,実際の生活交通シナリオにおける車両タイプ分類問題に対処し,融合コンテキストにおけるオーディオビジュアル様式の効率的な表現を用いた多モード法を提案した。キーフレームと対応する音声フラグメントを抽出することにより,ビデオデータから分離した視聴覚モダリティを示した。ビデオデータの視覚・音声モダリティからの深層畳込みニューラルネットワーク(CNN)とメル周波数ケプストラム係数(MFCC)特徴を抽出した。主成分分析(PCA)アルゴリズムを視覚部分に使用され,MFCC特徴ベクトルの統計的表現の様々なタイプが代表的な特徴を選択するために計算した。これら表現は,溶融ロバストなマルチモーダル特徴を形成した。最後に,得られた多様な特徴を用いた車両タイプの最終的な分類のためのサポートベクトルマシン(SVM)分類器を訓練した。単一および多モードの場合TRECVID2012SINビデオ性能データセット上で提案手法の有効性を評価した。著者らの結果は,GoogLeNet CNN特徴を持つ提案したMFCC表現を融合分類精度を改善する示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】

, , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

パターン認識

, , , , ,

前のページに戻る