特許
J-GLOBAL ID:200903097564490139
検索装置及び検索方法
発明者:
,
,
出願人/特許権者:
代理人 (4件):
中島 淳
, 加藤 和詳
, 西元 勝一
, 福田 浩志
公報種別:公開公報
出願番号(国際出願番号):特願2006-199312
公開番号(公開出願番号):特開2008-027207
出願日: 2006年07月21日
公開日(公表日): 2008年02月07日
要約:
【解決課題】ユーザにとって分かりやすいクラスタにより検索結果を表示することができるようにする。【解決手段】検索クエリログから、検索語に関連する複数の関連語を取得し(102)、複数の検索エンジンによって、検索語に対応してメタサーチを行い(104)、検索されたWebページからテキストデータを抽出し(108)、抽出したテキストデータを形態素解析して複数の単語を取得し(112)、複数のWebページに対する単語頻度行列を作成し(116)、関連語にのみ注目した関連語同士の類似度を算出する。(120)そして、算出された関連語同士の類似度に基づいて、関連語のクラスタリングを行い、所定数の関連語クラスタを生成し(122)、関連語の検索数に基づいて、関連語クラスタの重み付けを行い、関連語クラスタを順序付けてソートし(124)、関連語クラスタのリストを検索結果として表示する(128)。【選択図】図3
請求項(抜粋):
複数の文書データを記憶した文書データベースから、検索語に適合する複数の文書データを取得する文書データ取得手段と、
前記文書データ取得手段によって取得された複数の文書データの各々を形態素解析することによって得られた単語に基づいて、前記文書データの各々について、前記検索語に関連する複数の関連語の各々の出現頻度を算出する頻度算出手段と、
前記頻度算出手段によって算出された前記複数の関連語の各々の出現頻度に基づいて、各関連語同士の類似度を算出する類似度算出手段と、
前記複数の関連語のクラスタリングを行って、前記類似度算出手段によって算出された類似度が高い組み合わせから前記関連語を組み合わせて、所定数の関連語クラスタを生成するクラスタリング手段と、
前記クラスタリング手段によって生成された関連語クラスタを、前記検索語に適合する文書データの検索結果として表示する表示手段と、
を含む検索装置。
IPC (1件):
FI (3件):
G06F17/30 370Z
, G06F17/30 210D
, G06F17/30 320D
Fターム (2件):
引用特許: