文献
J-GLOBAL ID:200902297193369264   整理番号:08A1059410

商用検索エンジンの検索結果では取得できないランキング下位部分の収集・解析

著者 (4件):
資料名:
巻:号:ページ: 37-42  発行年: 2008年06月27日 
JST資料番号: L5754A  ISSN: 1883-1060  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
商用のWeb検索エンジンの多くは検索結果としてWebページのランキングを行い,ランキングが高いWebページから順に返すが,ランキング上位一定件数しか検索結果として返さない.ランキング外となったWebページを取得することができれば,ユーザ自らが検索結果を解析することにより,検索エンジンの特徴解析などの調査を行うことができる.そこで本稿では,検索エンジンにおいて取得検索結果件数の制限により取得できないランキングが下位のWebページをUnListed Search Result(ULSR)と名づけ,ULSRを取得する手法を提案した.提案手法では,クエリ中に「-」(マイナスオペレータ)を用いて検索問題を排他集合に細分化することにより,検索結果としてULSRを網羅することができるクエリを生成し,ULSRの収集を行う.また,提案手法をYahoo! JAPAN,Google,MSNに適用して収集されたULSRの傾向を知るために,ランキング上位のWebページ集合との比較を行った.その結果,ULSRには様々なトップレベルドメイン(TLD)が出現することがわかった.つまり検索エンジンの内部には様々なTLDを持つWebページがインデックス化されているのに対し,LSRにおいてはjpドメインとcomドメインが9割以上を占めていることが確認された.
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
情報検索一般  ,  計算機網 
引用文献 (19件):
  • Amazon.com: http://www.amazon.com/
  • A. Ntoulas, P. Zerfos and J. Cho: “Downloading Textual Hidden Web Content through Keyword Queries”, In Proc. of JCDL2005, pp. 100-109, Denver, Colorado (2005.7).
  • B. He, M. Patel, Z. Zhang and KC. C. Chang: “Accessing the Deep Web: A Survey”, CACM, Vol.50, pp. 94-101 (2007.5).
  • F. Geraci, M. Pellegrini, P. Pisati and F. Sebastiani: “A Scalable Algorithm for High-Quality Clustering of Web Snippes”, In Proc. of the 2006 ACM Symp. on Applied computing, pp. 1058-1062, Dijion, France (2006.4)
  • G. Mecca, S. Raunich and A. Rappalardo: “A New Algorithm for Clustering Search Results”, Data & Knowledge Engineering, Vol.63, Issue.3, pp. 504-522 (2007.12)
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る