文献
J-GLOBAL ID:200902251052375376   整理番号:09A1020767

ロボット聴覚のための2階層視聴覚統合を用いた音声認識システムの検討

Automatic Speech Recognition Improved by Two-Layered Audio-Visual Integration For Robot Audition
著者 (4件):
資料名:
巻: 27th  ページ: ROMBUNNO.1I3-04  発行年: 2009年09月15日 
JST資料番号: L4867A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ロボットによる実環境での音声認識では,雑音にロバストな音声認識が求められる。音声認識の性能は,音声認識エンジンの性能だけではなく発話区間検出の性能も大きく左右される。本稿では,2階層視聴覚統合により音声認識のロバスト性を向上させる手法を提案する。2階層視聴覚統合は,複数の特徴量を確率的統合するベイジアンネットに基づく視聴覚発話区間検出および音声/画像特徴量の信頼度の変化を扱うことができるミッシングフィーチャ-理論に基づく視聴覚音声認識から構成される。提案するアプローチを視聴覚音声認識システムに実装し,6種の雑音強度での評価実験を行い,平均9.8ポイントの単語正解精度向上を示した。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
ロボットの設計・製造・構造要素  ,  パターン認識 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る