抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
文書検索において単語の重み付けを行う方法の一つとしてTF・IDF法があげられる。IDFは文書集合での単語の出現しにくさを表わしており,検索対象の文書集合に依存する性質を持つ。そのため,クエリと同じ分野ではあまり出現しないためIDFが大きくなるような特定性が高い単語であっても,検索対象文書には出現しやすい単語であった場合にはIDFは小さくなってしまう問題がある。そこで本論文では,従来の検索手法を用いて検索対象の文書集合からクエリと同じ分野であると考えられる関連文書を抽出するステップと関連文書集合での出現頻度も用いて検索するステップの2段階に分ける手法を提案する。従来手法と比較するためNTCIR-1のIRタスクデータを用いて評価実験を行ったところ,一般的なベクトル空間モデルと比較して7.1%の精度向上が得られ,NTCIR-1で最も高精度だった結果と同等の精度が得られた。(著者抄録)