文献
J-GLOBAL ID:201802289802690480   整理番号:18A0589785

アナログ特徴抽出とディジタル深部ニューラルネットワークを用いた1μW音声活動検出器【Powered by NICT】

A 1μW voice activity detector using analog feature extraction and digital deep neural network
著者 (6件):
資料名:
巻: 2018  号: ISSCC  ページ: 346-348  発行年: 2018年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声ユーザインタフェイス(UI)は,ウェアラブルおよびモバイルデバイスのための高度に説得力のある。はコンパクトで超低電力(ULP)入力装置(例えば受動マイクロホン)を使用することの利点を持っている。ULP信号収集と処理に伴い,音声UIは人間との自然なインタラクションの人気の高い能力をエネルギーハーベスティング音響センサノードと電池デバイス動作を与えることができる。,背景雑音からの音声を分離することによって,音声活動検出(VAD)は,このような音声UIにおける重要なビルディングブロックである,例えば,話者同定と音声認識のような高レベルの音声タスクの電力ゲーティング[1]を可能にすることができる。常時ブロックとして,VADの電力消費を最小化しなければならず,一方高い分類精度を維持している。アナログ信号処理の高電力効率に触発されて,アナログ特徴抽出(AFE)と混合信号決定木(DT)分類器を用いたVADシステムは[2]で示された。6μWの記録を達成したが,システムは制御されたAFE変化によるチップ間に基づいてDTしきい値の機械学習に基づくキャリブレーションを必要とする。さらに,7ノードDTは低い入力SNRと種々のノイズシナリオの下で特に下分類精度を,深いニューラルネットワーク(DNNs)のようなより高度な分類器に比較して[1,3]かもしれない。従来の浮動小数点DNNにおける重い計算負荷は,組込みシステムにおけるそれらの採用を阻止するが,[4]で提案された二成分量と活性化を伴う二値ニューラルネットワーク(BNN)は,ULP実現への道を開く可能性がある。本論文では,事象をコードするA/D界面をもつAFEとデジタルBNN分類器を利用した1μW VADシステムを提案した。全AFEが最先端のディジタルフィルタバンク[6]よりも先行技術[5]及び7.9xよりも電力効率の良い9.4x,BNNはわずか0.63μWを消費する。高価なチップワイズ訓練を回避するために,AFEの意識したニシキヘビモデルを作成し,生成した特徴は,オフラインBNN訓練のために使用した。測定はレストラン騒音を10dBのSN比音声のための同じ重みを用いた10金型間の1.88%/4.65%1 σ標準偏差84.4%/85.4%の平均音声/非音声ヒット率を示した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  音声処理 

前のページに戻る