Pat
J-GLOBAL ID:200903050435729650
テキスト検索システム,インデックス作成装置,テキスト検索装置及びコンピュータ読み取り可能な記録媒体
Inventor:
Applicant, Patent owner:
Agent (1):
境 廣巳
Gazette classification:公開公報
Application number (International application number):1997213993
Publication number (International publication number):1999039347
Application date: Jul. 24, 1997
Publication date: Feb. 12, 1999
Summary:
【要約】【課題】 検索過剰を抑制しつつ、異表記の同義語による検索も可能にする。【解決手段】 テキストから単語インデックス18を作成する際、単語の見出しとその単語を含むテキストの情報だけでなく、形態素解析で得られたその単語の品詞(例えば「米」について固有名詞),属性追加手段100 で追加されたその単語の属性(例えば「米」について国名)の情報を登録する。また、単語の品詞や属性に基づき多義性のある語(例えば「米」について「アメリカ」)を展開して登録する。検索時、検索キー(例えば「アメリカ」)が入力されると、テキスト検索手段7はその単語で単語インデックス18を検索し、「アメリカ」のみならずその同義語である「米」を含むテキストの情報も得る。また品詞や属性を検索条件とした検索キーが入力されると、テキスト検索手段7は、単語と品詞または属性の情報との双方を満たす単語を含むテキストの情報を単語インデックス18から検索する。
Claim (excerpt):
検索対象となるテキストを形態素解析し、テキスト中に含まれる単語とその品詞とを検出する形態素解析手段と、検出された単語及び品詞とその単語が出現するテキストの情報とを、単語インデックスに登録する単語インデックス作成手段とを備えるインデックス作成装置。
FI (2):
G06F 15/40 370 A
, G06F 15/401 310 A
Patent cited by the Patent:
Cited by examiner (3)
-
文書検索装置
Gazette classification:公開公報
Application number:特願平7-228919
Applicant:株式会社東芝
-
特開平3-172966
-
文書検索装置
Gazette classification:公開公報
Application number:特願平6-287215
Applicant:富士ゼロックス株式会社
Return to Previous Page