文献
J-GLOBAL ID:201302222048851751   整理番号:13A0803798

音声ドキュメントの音響情報セグメント量子化を用いた音声検索語検出

著者 (3件):
資料名:
巻: 6th  ページ: SDPWS2012-07 (WEB ONLY)  発行年: 2012年 
JST資料番号: U0251A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声データを含むマルチメディアコンテンツが大量に蓄積されるようになり,発声内容に対する検索のニーズが高まっている。与えられた検索語を音声データから検出する検索語検出(STD:Spoken Term Detection)の研究が広く行われている。検索対象の音声ドキュメントの表現手法として,音響情報をベクトル量子化(VQ)して得られるVQコード列を用い,あらかじめ学習しておくVQコード列とサブワードの関連度(V-Pスコア)に基づいて,テキスト入力された検索語との照合を行う手法がすでに提案されている。これまでは複数の閾値処理によって検索語の検出が決定されていたが,今回の報告では複数の特徴をもとに算出する統合スコアを用いる手法について述べる。さらに,音声の時間構造を表現するために,セグメント量子化を導入し,局所スコアの算出に音素を前後に分割する半音素とV-Pコードとの共起関係を用いる手法について述べる。評価実験によって,検出性能において従来手法よりも優れていることが示されている。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  パターン認識 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る