抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
クラスタベースの情報検索は情報検索(IR)ツールの1つであり,その類似性に従ってWeb文書を組織化,抽出,分類する。従来の手法とは異なり,クラスタベースのIRは文書の大規模データセットを処理する際に高速である。検索された文書の品質を改善するために,IRの効率を高め,ユーザ検索から無関係な文書を縮小し,著者らは,マルチデームとマスタ/スレーブPGアルゴリズムのハイブリッドPGとK平均クラスタリングアルゴリズムを結合する(K-平均)-階層的並列遺伝的アルゴリズムアプローチ(HPGA)を提案した。K-平均は,母集団をk亜集団にクラスタ化するために利用し,次に,2つのレベルの遺伝的並列性によって並列方法で操作するクエリに関連する大部分のクラスタを取り上げ,その結果,結果の品質を改善する方法として,無関係な文書は亜集団に含まれない。3つの共通データセット(NLP,CISI,およびCACM)を用いて,想起,精度,およびF測度平均を計算した。最後に,遺伝的IRと古典的IRとの3つのデータセットの精度値を比較した。IR-GAによる提案方法精度改善はCACMで45%,CISIで27%,NLPで25%であった。一方,Classic-IRと比較して,(k-means)-HPGAはCACMで47%,CISIで28%,NLPで34%であった。【JST・京大機械翻訳】