文献
J-GLOBAL ID:201302269765530710   整理番号:13A1888958

検索ヒット数の正確性評価:大規模クロールデータに対する文書頻度との比較

著者 (5件):
資料名:
巻: 12  号:ページ: 13-18  発行年: 2013年06月21日 
JST資料番号: L5754A  ISSN: 1883-1060  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Webコンテンツを活用した研究では,検索エンジンの結果を利用することが多い。しかし,検索エンジンのヒット数の誤差は,時折,増大することがある。本稿では,大規模なWebクローリングによって得られたデータに対して,検索ヒット数と文書頻度を比較し,ヒット数の正確性を評価した。Web上の網羅的文書に対して単語統計を得るためのクローリング方法と文書頻度のカウント方法を示した。4,000万ページのWebを調査した。完全一致検索で得たヒット数の文書頻度に対するピアソン積率相関係数は0.807となった。これは,時系列的に安定しているヒット数だけを用いることで,0.897に向上した。数日間安定しているヒット数は,その値の正確性が高いことを示している。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
検索技術 
引用文献 (20件):
もっと見る

前のページに戻る