抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
著者らはWeb Robotが自動収集したWeb上のテキストデータをWebデータベースに蓄積し,通常の検索要求において主体となる名詞のみを切り出して,名詞テーブルを作成・利用する小規模なWeb検索システムを開発した。本論文では,名詞テーブルの作成を高速化するためにその日本語形態素解析部分をPC(Personal Computer)クラスタ上で並列分散処理化し,URL(Uniform Resource Locator)1000件のページデータを用いてその効果を検証した。名詞テーブルの作成に1,2,5,10台のマシンを割り当てた場合の処理時間を比較し,ほぼリニアに台数効果が現れることを確かめた。また,単語ごとの名詞テーブルが個別に存在するだけでは複合検索要求での処理時間がかかるので,検索要求に合わせた複合名詞テーブルをキャッシュとして作成することで時間短縮効果を調べた。実際に「静岡県袋井市」のような複合検索要求を名詞テーブルを導入せずに検索すると12.5秒かかり,名詞テーブルのドッキングによると4.43秒,ドッキング処理結果のキャッシュを用いると0.55秒と高速な応答性が維持できることがわかった。