文献
J-GLOBAL ID:200902248489466078   整理番号:08A0955368

ロボット聴覚のためのソフトマスク生成法による周辺話者音声認識率の改善

Improving Speech Recognition of Periphery Talkers by Generating Soft Masks for Robot Audition
著者 (5件):
資料名:
巻: 26th  ページ: ROMBUNNO.1A1-01  発行年: 2008年09月09日 
JST資料番号: L4867A  資料種別: 会議録 (C)
記事区分: 短報  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ロボットが人間と協調するには,音声認識は欠かせない。複数話者が同時発話しても目的の音声を認識する必要がある。本報告では,ミッシングフィーチャ理論に基く音声認識のためのソフトマスク自動生成手法を提案する。マスクは,音響特徴量の信頼度の役割を果たす。認識時の音響尤度計算に重みを置くことに相当する。従来0,1のバイナリマスクを0~1の連続値の信頼度を扱うように拡張した。静的スペクトル特徴と動的スペクトル特徴間に重みを導入することで,認識率を改善した。従来のバイナリマスクと比べ,3話者同時発話単語認識実験で平均で5%の改善が得られた。周辺話者に関しては,最大で8%の改善が得られた。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
ロボットの設計・製造・構造要素 

前のページに戻る