抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
著者らは以前に有色性駆動源カルマンフィルタを用いて臨場感のあるステレオ型ボーカルオフを実現したが,音質が劣化する問題点があった。本論文では,左右の楽曲信号に等しく含まれるボーカル信号からTEO(Teager Energy Operator)を用いて特徴量を算出する,ステレオ型ボーカル抑圧手法を提案した。本手法では,1)左右楽曲信号とGaborフィルタの畳込みによる左右音声帯域信号の算出,2)TEOを用いた左右音声特徴量の算出,及びそれを用いた閾値αの算出,3)高速フーリエ変換(FFT)した左右楽曲スペクトルからのαによるボーカルスペクトルの判別,及び推定ボーカルスペクトルの逆FFTによる分散値の算出,4)左右のBGM信号からなる状態方程式とステレオ楽曲信号の生成式(観測方程式)からなる状態空間モデルに対する有色性駆動源カルマンフィルタの適用という手順をとる。従来手法と正規化平均二乗誤差を比較したところ,本手法で生成された左右カラオケ信号の方がBGMだけの信号に類似していた。また,スペクトル評価ではBGMだけの信号との差がなく,左右のスペクトルが異なることから臨場感のあるステレオBGM信号を実現できた。さらに,50人の被験者によるMOS(Mean Opinion Score)評価では従来手法よりも高い値が得られ,高音質を維持していることが確かめられた。