抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声認識の前段階として用いられる音声区間検出技術(Voice Activity Detection,VAD)には高い雑音区間除去能力が求められる。耐雑音性を向上させる手法のひとつとしてマルチモーダルVADがあり,音声のノイズに影響を受けない画像情報を用いることで精度向上が期待できる。本報告では各モダリティから得られた結果をブースティングによって統合する,マルチモーダルVADの結果統合について検討を行う。AdaBoostは機械学習の手法のひとつであり,複数の弱識別器を統合することで強識別器を作成する。学習によって各学習器毎に求められた重みを考慮して2クラス分類が行われる。提案手法では音声/画像特徴量を識別器として学習を行い,各特徴量から得られた結果を用いた重みつき多数決で結果統合を行う。実験結果から,雑音重畳環境下では画像特徴量に重みを付与した多数決による結果統合が有効であることがわかった。(著者抄録)