文献
J-GLOBAL ID:201202294933287891   整理番号:12A0723094

ロバストな自動音声認識のためのスペクトル-時間変調部分空間スパニングフィルタバンク特徴

Spectro-temporal modulation subspace-spanning filter bank features for robust automatic speech recognition
著者 (3件):
資料名:
巻: 131  号:ページ: 4134-4151  発行年: 2012年05月 
JST資料番号: C0249A  ISSN: 0001-4966  CODEN: JASMAN  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自動音声認識(ASR)システムのロバスト性を向上する試みの中で,スペクトル-時間変調周波数(MF)を考慮に入れた特徴抽出法を提示した。この生理学的に示唆されたシステムはGaborフィルタに基づく二次元フィルタバンクを使用し,これが特徴成分間の冗長情報を制限し,また物理的に解釈可能な特性を生じる。外因性変動(いろいろな種類の付加騒音)および内因性の変動性(発声の速度,動作および様式の変化から発生)に対するロバスト性は,一連の認識実験によって定量化した。これらの結果は,それぞれメル周波数ケプストラム係数(MFCC),ケプストラム平均減算(CMS)およびRASTA-PLP特性を使った基準ASRシステムと比較した。Gabor特性は,CMSを持たないベースラインシステムより外因性変動に対してロバストであり,2つの訓練条件(それぞれクリーンな訓練サンプルだけ,あるいは騒音を含む発声とクリーンな発声の混合を使った場合)について28%および16%の相対的な改善があることを示した。最新のシステムに使った場合,スペクトル-時間特性をMFCCに結び付けると14%の改善が観察され,これらの特徴形式の相補性を示した。特定MFの重要性の解析によって,25Hzまでの時間MFおよび0.25サイクル/チャネルまでのスペクトルMFがASRにとってメリットがあることを示した。(翻訳著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る