抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
一定の時間長の音データを会話,音楽,会話+BGM,歌声+音楽の4種類の音種別に識別する手法を検討する。従来手法には,識別対象の音データとして,音声,音楽などの単一の音種別の音データを用いた研究や,それらが重畳した音データを用いた研究がある。しかし,識別対象とする音種別の種類が十分でない問題や精度の問題などがあり,複数の音種別が重畳している場合も,音量比を正規化して人工的に重畳した音データを使用するという制約がある。そこで,本研究では単一の音種別の音データと,重畳音の音量比が不確定な音データの識別手法について検討した。各音種別は,短時間スペクトルの時間的な変化の特徴がそれぞれ異なるため,各音種別ごとのソナグラムの特徴を反映した特徴量を考案して識別に利用した。考案した特徴量を用いて学習により識別器を作成し,識別実験を行って識別手法の有効性を検証した。さらに,音データの時間長を変化させて,音データの時間長と識別精度の関係を調査した。音データの時間長を2秒とした識別実験では,各音種別に対する識別結果の平均F尺度は74.8%となった。(著者抄録)