文献
J-GLOBAL ID:202002272552730084   整理番号:20A0445701

音声中の検索語検出におけるクエリの関連語を利用したリスコアリング方式

Rescoring by Using Words Related to a Query for Spoken Term Detection
著者 (5件):
資料名:
巻: 61  号:ページ: 103-112 (WEB ONLY)  発行年: 2020年01月15日 
JST資料番号: U0452A  ISSN: 1882-7764  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声中で検索したいキーワードが話されている箇所を特定する音声中の検索語検出(STD:Spoken Term Detection)の研究がさかんに行われている.検索精度向上のために,先行研究として高順位候補を含むドキュメント内のすべての候補の照合距離を有利にする方式等が提案されている.本論文では,クエリを含む講演内で話されるトピックの内容に関連してクエリと共起する単語をクエリの関連語と呼び,関連語は当該講演内に複数回出現すると仮定する.クエリの関連語を特定するため,本論文ではWord2vecを用いた単語の分散表現が有効と考える.音声ドキュメントの単語認識結果中の各単語をWord Vector化し,クエリのWord Vectorと比較し,類似度を求めることでクエリの関連語を取得する.一方,未知語(OOV:Out-of-Vocabulary)クエリは単語認識結果に出現しないためWord Vectorを算出できないため,本論文ではWeb検索を併用する方式を採用し,クエリでWeb検索し得られたテキスト中の出現単語もWord2vecに用いてクエリの意味的情報を補い,未知語クエリのWord Vectorを算出できるようにする.これにより,未知語クエリに対応させることができ,既知語(IV:In Vocabulary),未知語いずれのクエリでも関連語を的確に求められると考える.以上のようにして,クエリの関連語を特定し,関連語を含むドキュメント内のすべての候補の距離を有利にすることで検索精度の向上を図る.NTCIR-10,12のFormal Runの2種のテストセットを用いて評価した結果,両テストセットで検索精度が向上した.また,先行方式と併用することでさらに精度が向上し,提案方式の有効性を確認できた.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  自然語処理 
引用文献 (17件):
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る