文献
J-GLOBAL ID:201002291231561592   整理番号:10A1020163

小規模PC clusterを用いた並列分散サーチエンジンシステムについて

著者 (2件):
資料名:
巻: 18  ページ: 63-66  発行年: 2010年06月01日 
JST資料番号: L4786A  ISSN: 0919-5440  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
著者らはWeb Robotが自動収集したWeb上のテキストデータをWebデータベースに蓄積し,通常の検索要求において主体となる名詞のみを切り出して,名詞テーブルを作成・利用する小規模なWeb検索システムを開発した。本論文では,名詞テーブルの作成を高速化するためにその日本語形態素解析部分をPC(Personal Computer)クラスタ上で並列分散処理化し,URL(Uniform Resource Locator)1000件のページデータを用いてその効果を検証した。名詞テーブルの作成に1,2,5,10台のマシンを割り当てた場合の処理時間を比較し,ほぼリニアに台数効果が現れることを確かめた。また,単語ごとの名詞テーブルが個別に存在するだけでは複合検索要求での処理時間がかかるので,検索要求に合わせた複合名詞テーブルをキャッシュとして作成することで時間短縮効果を調べた。実際に「静岡県袋井市」のような複合検索要求を名詞テーブルを導入せずに検索すると12.5秒かかり,名詞テーブルのドッキングによると4.43秒,ドッキング処理結果のキャッシュを用いると0.55秒と高速な応答性が維持できることがわかった。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
ディジタル計算機方式一般  ,  その他の情報処理  ,  自然語処理 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る