文献
J-GLOBAL ID:201302240172438461   整理番号:13A0521857

音声情報案内システムにおけるBag-of-Wordsを用いた無効入力の棄却

Invalid Input Rejection Using Bag-of-Words for Speech-oriented Guidance System
著者 (8件):
資料名:
巻: 54  号:ページ: 443-451  発行年: 2013年02月15日 
JST資料番号: Z0778B  ISSN: 1882-7837  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
実環境における音声認識を用いた情報案内システムでは,雑音等の非音声やユーザ同士の背景会話など,システムへの入力として不適切な入力が存在する。これらの入力はシステムの誤作動・誤認識の原因となるので,システムへの入力として適切な入力(有効入力)と不適切な入力(無効入力)の識別を行い,無効入力を棄却することにより,無効入力に対する応答処理を行わないことが重要である。従来,有効入力と無効入力との識別には,メル周波数ケプストラム係数などの音響的特徴量によるGMM(Gaussian Mixture Model)が用いられる。しかし,入力データの音声認識結果から得られる言語的な情報を使うことにより,システムのタスクを考えたうえで有効入力と無効入力の識別が可能になると考えられる。そこで本論文では,音響特徴量にBag-of-Words(BOW)を言語的特徴量として併用した無効入力の識別を検討した。識別手法としては,サポートベクタマシン(SVM)および最大エントロピー法を用いた。実験には実環境音声情報案内システム「たけまるくん」の入力データを用いた。SVMによる識別結果では,GMMによる音響尤度のみを用いた場合に比べて,BOWを用いた場合,F尺度を82.19%から85.41%に改善することができた。さらに,GMMによる音響尤度,発話時間,SNRを組み合わせた特徴量にBOWを追加することで,F尺度を86.58%まで改善することができた。詳細な分析の結果,BOWは特に無効入力の誤受理を減らす効果があることが示された。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  その他の情報処理  ,  人工知能 
引用文献 (20件):
タイトルに関連する用語 (1件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る