文献
J-GLOBAL ID:201002271970657076   整理番号:10A0772044

ブースティングによるマルチモーダル音声区間検出の結果統合

Decision Fusion using Boosting Method for Multi-Modal Voice Activity Detection
著者 (4件):
資料名:
巻: 110  号: 81(SP2010 22-34)  ページ: 25-30  発行年: 2010年06月10日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声認識の前段階として用いられる音声区間検出技術(Voice Activity Detection,VAD)には高い雑音区間除去能力が求められる。耐雑音性を向上させる手法のひとつとしてマルチモーダルVADがあり,音声のノイズに影響を受けない画像情報を用いることで精度向上が期待できる。本報告では各モダリティから得られた結果をブースティングによって統合する,マルチモーダルVADの結果統合について検討を行う。AdaBoostは機械学習の手法のひとつであり,複数の弱識別器を統合することで強識別器を作成する。学習によって各学習器毎に求められた重みを考慮して2クラス分類が行われる。提案手法では音声/画像特徴量を識別器として学習を行い,各特徴量から得られた結果を用いた重みつき多数決で結果統合を行う。実験結果から,雑音重畳環境下では画像特徴量に重みを付与した多数決による結果統合が有効であることがわかった。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
引用文献 (9件):
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る