特許
J-GLOBAL ID:200903006617199398

文書検索支援方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 伊東 忠彦 ,  石原 隆治
公報種別:公開公報
出願番号(国際出願番号):特願2006-089417
公開番号(公開出願番号):特開2007-265034
出願日: 2006年03月28日
公開日(公表日): 2007年10月11日
要約:
【課題】利用者が指定する検索条件に基づく検索結果の整理と提示を、事前の特殊な準備を要せずに実現する。【解決手段】本発明は、入力された検索条件に合致する文書を、文書記憶手段から取得した文書それぞれの重心位置を特定し、各文書中から、重心位置を中心とする一定範囲内に出現する単語と該単語の出現回数を集計して、文書毎のベクトルを取得し、各文書のベクトル間の距離を計算し、距離が近い文書同士を統合してクラスタを形成させ、クラスタの構成文書のベクトルを参照し、該クラスタの形成に強い影響を及ぼした1以上の単語を、クラスタ毎に選択し、クラスタの構成文書のそれぞれについて、主要キーワードの出現位置を特定し、該出現位置を中心とする一定範囲を文書の重要箇所として取得する。【選択図】図1
請求項(抜粋):
検索対象とする文書を格納した文書記憶手段、文書検索手段、重心選択手段、ベクトル生成手段、ベクトル記憶手段、クラスタ生成手段、クラスタ記憶手段を有する文書検索支援装置において、利用者が要求する検索条件に合致する文書を検索するための文書検索支援方法であって、 前記文書検索手段が、前記利用者から入力された前記検索条件に合致する文書を、前記文書記憶手段から取得する文書検索ステップと、 前記重心選択手段が、前記文書検索ステップで取得した文書それぞれについて、前記検索条件を構成する単語が互いに近い位置に密集して出現する箇所を重心位置として特定する重心選択ステップと、 前記ベクトル生成手段が、前記文書記憶手段から取得した各文書中から、前記重心位置を中心とする一定範囲内に出現する単語と該単語の出現回数を集計して、文書毎のベクトルを取得し、前記ベクトル記憶手段に格納するベクトル生成ステップと、 前記クラスタ生成手段が、前記ベクトル記憶手段に格納されている各文書のベクトル間の距離を計算し、距離が近い文書同士を統合してクラスタを形成させ、前記クラスタ記憶手段に格納するクラスタ生成ステップと、 を行うことを特徴とする文書検索支援方法。
IPC (1件):
G06F 17/30
FI (3件):
G06F17/30 210D ,  G06F17/30 170A ,  G06F17/30 350C
Fターム (4件):
5B075ND03 ,  5B075NR12 ,  5B075QM05 ,  5B075UU06
引用特許:
前のページに戻る