文献
J-GLOBAL ID:202002257489486209   整理番号:20A0838989

確率的情報検索を強化するためのトピックに基づく項周波数正規化フレームワーク【JST・京大機械翻訳】

A topic-based term frequency normalization framework to enhance probabilistic information retrieval
著者 (6件):
資料名:
巻: 36  号:ページ: 486-521  発行年: 2020年 
JST資料番号: A1312A  ISSN: 0824-7935  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多くのよく知られた確率的情報検索モデルは,文書ランキング,特にBM25における利用に対して有望であることを示している。それにもかかわらず,BM25における制御パラメータは,通常,異なるデータセットにおいて改善された性能を達成するために調整される必要があることが観察される。さらに,単語モデル上のBM25における仮定は,文または文書レベルに存在する豊富な情報の直接利用を妨げる。BM25に関する上記の課題に触発されて,著者らは最初に,BM25(本論文におけるBM25_QLと呼ばれる)における用語頻度に関する新しい正規化方法を提案した。さらに,CRTER_2を構築するために,この方法を最近のBM25ベースのモデルであるCRTER_2に組み込んだ。次に,トピックモデリングと単語埋込みをBM25に組み込み,単語モデルの仮定を緩和した。この方向において,著者らは,BM25のためにトピックベースの検索モデル,TopTFを提案する。それは次に言語モデル(LM)と多重アスペクト項頻度(MATF)モデルにさらに組み込まれる。さらに,埋め込みに基づく,増強されたトピックベースの用語周波数正規化フレームワーク,ETopTFを提示した。実験研究はこれらの方法の大きな有効性と性能を実証した。特に,すべてのテストしたデータセットと平均精度(MAP)に関して,著者らの提案したモデル,BM25_QLとCRTER_2~QLは,最良のbパラメータ値を有するBM25とCRTER_2に匹敵した。TopTFモデルはベースラインよりも有意に優れており,ETopTFモデルはMAPに関してTopTFをさらに改善することができた。Copyright 2020 Wiley Publishing Japan K.K. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  検索技術 

前のページに戻る