特許
J-GLOBAL ID:200903044004585960
情報検索装置、情報検索方法およびプログラム
発明者:
,
出願人/特許権者:
代理人 (1件):
川久保 新一
公報種別:公開公報
出願番号(国際出願番号):特願2005-156702
公開番号(公開出願番号):特開2006-331245
出願日: 2005年05月30日
公開日(公表日): 2006年12月07日
要約:
【課題】 単語の重要度を考慮する機能と、概念ベースによる単語の意味的類似性を定量化する機能とを兼ね備えている情報検索装置等を提供することを目的とする。【解決手段】 検索対象の各文書を単語分割し、各文書と単語分割によって得られる各異なり単語との対に対し、文書・単語間統計量の情報に基づいて、上記対の重みを算出し、上記文書毎に、上記各異なり単語で、単語と上記単語の意味を表現するベクトルとの対の集合が格納されている単語ベクトルデータベースを検索して得られるベクトルと、上記異なり単語の重みとを乗じ、この結果得られたベクトルを、全異なり単語にわたって加算し、この結果得られるベクトルを、全異なり単語の重みの和で割って得られるベクトルを、上記文書のベクトルとして算出し、上記文書と上記文書のベクトルとの対を文書ベクトルデータベースに格納する。【選択図】 図1
請求項(抜粋):
自然言語文が入力されると、適合する文書を検索する情報検索装置において、
検索対象の各文書を単語分割し、記憶装置に記憶する単語分割手段と;
上記各文書と上記単語分割手段によって得られる各異なり単語との対に対し、文書・単語間統計量の情報に基づいて、上記対の重みを算出し、記憶装置に記憶する文書単語対重み算出手段と;
上記文書毎に、上記各異なり単語で、単語と上記単語の意味を表現するベクトルとの対の集合が格納されている単語ベクトルデータベースを検索して得られるベクトルと、上記異なり単語の重みとを乗じ、この結果得られたベクトルを、全異なり単語にわたって加算し、この結果得られるベクトルを、全異なり単語の重みの和で割って得られるベクトルを、上記文書のベクトルとして算出し、記憶装置に記憶する文書ベクトル算出手段と;
上記文書と上記文書のベクトルとの対を文書ベクトルデータベースに格納する格納手段と;
を有することを特徴とする情報検索装置。
IPC (1件):
FI (3件):
G06F17/30 330C
, G06F17/30 170A
, G06F17/30 350C
Fターム (10件):
5B075ND03
, 5B075NK06
, 5B075NK21
, 5B075NK32
, 5B075NR02
, 5B075NR05
, 5B075PP24
, 5B075PR06
, 5B075QM08
, 5B075UU05
引用特許: