文献
J-GLOBAL ID:201702263747301686   整理番号:17A0662571

品質向上と話者認識のための単側波帯周波数オフセット推定と補正【Powered by NICT】

Single Sideband Frequency Offset Estimation and Correction for Quality Enhancement and Speaker Recognition
著者 (2件):
資料名:
巻: 25  号:ページ: 120-132  発行年: 2017年 
JST資料番号: W0508B  ISSN: 2329-9290  CODEN: ITASFA  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
通信システム不整合により,音声品質および話者認識システム性能の両方の損失の大きな影響を示した。マイクロホンとハンドセット差は,話者認識(例えば,NIST SRE)に対して考慮されているが,変調/復調(Mod/DeMod)キャリア不整合のような非線形通信システム差は探られていない。このような不整合は,今日,従来のアナログ通信における共通した通信技術の多様性と混合では,主要な歪として見直されてきている。高周波単一側波帯(HF SSB)音声におけるMod/DeModキャリア周波数不整合に起因する周波数シフト歪を推定し,補正に焦点を当てた。既存の解の欠点を克服するために,推定性能を改善するために提案する二段階アルゴリズム。第一段階では,音声のオフセットは小さい周波数間隔,スペクトル内の周期性による非一意性問題を除去あるいは減少させるに合わせて調整されます第二段階は,推定した所定の一意性間隔(UI)内の微調整を行う。初めて,UI検出,革新的な音響特徴は,代替周波数シフトを表すために提案しているが開発した統計的フレームワーク。これに加手,推定過程において,GMM-SVM,iベクトル,および深層ニューラルネットワークなどの統計的手法が,推定精度を改善するための第一段階に適用した。DARPAラットを用いた評価HF SSBデータは,提案したアルゴリズムが推定性能(精度+35.6%まで改善),音声品質測定(PESQスコアにおける+27.3%までの相対的改善),および話者検証(等誤り率における+59.9%までの相対的改善)の有意な改善を達成することを示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る