音声ドキュメントの音響情報セグメント量子化を用いた音声検索語検出

松永徹; CHO Kook; 山下洋一

文献

J-GLOBAL ID：201302222048851751 整理番号：13A0803798

音声ドキュメントの音響情報セグメント量子化を用いた音声検索語検出

出版者サイト複写サービスで全文入手
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=13A0803798&from=J-GLOBAL&jstjournalNo=U0251A") }}

著者 (3件)： , ,
資料名：
巻： 6th ページ： SDPWS2012-07 (WEB ONLY) 発行年： 2012年
JST資料番号： U0251A 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

音声データを含むマルチメディアコンテンツが大量に蓄積されるようになり,発声内容に対する検索のニーズが高まっている。与えられた検索語を音声データから検出する検索語検出(STD:Spoken Term Detection)の研究が広く行われている。検索対象の音声ドキュメントの表現手法として,音響情報をベクトル量子化(VQ)して得られるVQコード列を用い,あらかじめ学習しておくVQコード列とサブワードの関連度(V-Pスコア)に基づいて,テキスト入力された検索語との照合を行う手法がすでに提案されている。これまでは複数の閾値処理によって検索語の検出が決定されていたが,今回の報告では複数の特徴をもとに算出する統合スコアを用いる手法について述べる。さらに,音声の時間構造を表現するために,セグメント量子化を導入し,局所スコアの算出に音素を前後に分割する半音素とV-Pコードとの共起関係を用いる手法について述べる。評価実験によって,検出性能において従来手法よりも優れていることが示されている。(著者抄録)

, , , , , ,
, , , , ,

音声処理 , パターン認識

, , , ,

前のページに戻る