抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
商用のWeb検索エンジンの多くは検索結果としてWebページのランキングを行い,ランキングが高いWebページから順に返すが,ランキング上位一定件数しか検索結果として返さない.ランキング外となったWebページを取得することができれば,ユーザ自らが検索結果を解析することにより,検索エンジンの特徴解析などの調査を行うことができる.そこで本稿では,検索エンジンにおいて取得検索結果件数の制限により取得できないランキングが下位のWebページをUnListed Search Result(ULSR)と名づけ,ULSRを取得する手法を提案した.提案手法では,クエリ中に「-」(マイナスオペレータ)を用いて検索問題を排他集合に細分化することにより,検索結果としてULSRを網羅することができるクエリを生成し,ULSRの収集を行う.また,提案手法をYahoo! JAPAN,Google,MSNに適用して収集されたULSRの傾向を知るために,ランキング上位のWebページ集合との比較を行った.その結果,ULSRには様々なトップレベルドメイン(TLD)が出現することがわかった.つまり検索エンジンの内部には様々なTLDを持つWebページがインデックス化されているのに対し,LSRにおいてはjpドメインとcomドメインが9割以上を占めていることが確認された.