文献
J-GLOBAL ID:201702258870786267   整理番号:17A0218028

話者クラスタリングに基づく短時間発話音声認識

著者 (5件):
資料名:
巻: J100-D  号:ページ: 81-92 (WEB ONLY)  発行年: 2017年01月01日 
JST資料番号: U0473A  ISSN: 1881-0225  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声認識システムにおいて話者の多様性は認識精度を低下させる大きな要因となるため,システムを対象話者に適応させる話者適応に関する研究がこれまで活発に行われてきた。しかし,提案されている多くの話者適応手法は数十秒から数分程度の適応データを想定しており,短時間発話に対する適応は考慮されていない。そこで本研究では,短時間発話を対象とした話者適応技術の提案を行う。そのために,学習データのクラスタリングを基に話者クラスを定め,この話者クラス群をモデル化した混合ガウス分布と発話との間の対数ゆう度で話者の情報を表現する。これらの対数ゆう度を話者情報として使用し,かつ話者情報推定に使用する発話長を発話先頭0.5秒と制限することで,短時間発話認識のための話者適応技術の評価を行う。評価実験の結果,話者情報を音響特徴量とともにDNN(Deep Neural Network)へ入力することで,話者情報を使用しない場合と比較して7%の相対誤り削減率を得ることができ,短時間発話に対する本手法の有効性が明らかになった。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
引用文献 (39件):
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る