特許
J-GLOBAL ID:200903019322618881

同姓同名文書分別装置及びプログラム

発明者:
出願人/特許権者:
代理人 (2件): 伊東 忠彦 ,  石原 隆治
公報種別:公開公報
出願番号(国際出願番号):特願2007-306431
公開番号(公開出願番号):特開2009-129373
出願日: 2007年11月27日
公開日(公表日): 2009年06月11日
要約:
【課題】人物の情報を検索する際に、同姓同名の異なる人物の文書を分離して利用者が所望する特定人物だけの検索結果を入手する。【解決手段】本発明は、人物名に基づいて検索された文書を文書記憶手段に蓄積しておき、文書記憶手段から文書を読み込んで特徴ベクトルを抽出し、文書ベクトル記憶手段に格納し、文書ベクトル記憶手段から特徴ベクトルを読み込んで、クラスタリングし、類似したベクトルのクラスタ群を生成し、クラスタ記憶手段に格納し、クラスタ記憶手段からクラスタ群に含まれるベクトルに対応する文書を文書記憶手段から取得して文書のクラスタを生成し、記文書のクラスタを出力する。【選択図】図1
請求項(抜粋):
同姓同名を含む人物についての文書を分類するための同姓同名文書分別装置であって、 人物名に基づいて検索された文書を蓄積する文書記憶手段と、 前記文書記憶手段から前記文書を読み込んで特徴ベクトルを抽出し、文書ベクトル記憶手段に格納する文書ベクトル生成手段と、 前記文書ベクトル記憶手段から前記特徴ベクトルを読み込んで、クラスタリングし、類似したベクトルのクラスタ群を生成し、クラスタ記憶手段に格納する文書ベクトルクラスタリング手段と、 前記クラスタ記憶手段から前記クラスタ群に含まれるベクトルを読み込み、該ベクトルに対応する文書を前記文書記憶手段から取得して文書のクラスタを生成する文書分類手段と、 生成された前記文書のクラスタを出力する分類結果提示手段と、 を有することを特徴とする同姓同名文書分別装置。
IPC (1件):
G06F 17/30
FI (2件):
G06F17/30 210D ,  G06F17/30 170A
Fターム (4件):
5B075ND03 ,  5B075NK04 ,  5B075NR12 ,  5B075UU40

前のページに戻る