文献
J-GLOBAL ID:202002285668568064   整理番号:20A0066078

合成音声検出のための長期高周波特徴【JST・京大機械翻訳】

Long-term high frequency features for synthetic speech detection
著者 (2件):
資料名:
巻: 97  ページ: Null  発行年: 2020年 
JST資料番号: W1600A  ISSN: 1051-2004  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,自動話者照合システムにおいて,スポフィング攻撃の検出が重要になっている。長期情報は合成音声攻撃の検出に有用であることが分かった。本研究では,長期定Q変換(CQT)ベースの特徴から高周波情報を調べることに焦点を当てた。この目的のために,最初に,逆オクターブパワースペクトルと逆線形パワースペクトルに離散余弦変換(DCT)を用いて,逆定Q係数(ICQC)と逆定Qケプストラム係数(ICQCC)の2つの新しい特徴を導出した。さらに,完全な周波数帯から抽出された特徴を避けることができるDCTによる重複ブロック変換の使用によって,本研究を拡張し,いくつかの特定の周波数帯における局所雑音によって容易に影響を受けた。逆オクターブブロックと逆線形ブロックから導いた二つの他の新しい特徴は,それぞれ,一定Qブロック係数(ICBC)と逆定Q線形ブロック係数(ICLBC)と呼ばれる。2015年のASVspot,2015年のノイズのあるASVspot,および2019の論理アクセスコーパスのASVspotに関する提案された特徴を研究した。提案した4つの特徴に対して,著者らの実験結果は,ICQBC,ICBC,ICQCが,2015年のASVspot,2015年の雑音のあるASVspot,および2019の論理アクセスデータベースのASVspotにおいて,それぞれ最良の性能を提供することを示した。Copyright 2020 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  医用画像処理  ,  パターン認識 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る