Pat
J-GLOBAL ID:200903035260147467

キーワード抽出装置

Inventor:
Applicant, Patent owner:
Agent (1): ▲柳▼川 信
Gazette classification:公開公報
Application number (International application number):1996165407
Publication number (International publication number):1998011460
Application date: Jun. 26, 1996
Publication date: Jan. 16, 1998
Summary:
【要約】【課題】 文書中のキーワードを高速にかつその使われ方まで考慮して抽出可能とする。【解決手段】 文字分解手段2は文書格納手段1に格納された日本語文書を1文字ずつに分解して文字の並びとし、文字格納手段3に格納する。文字種別判断手段4は文字の並びの各文字の文字種別が漢字、カタカナ、英字、その他のいずれであるかをその文字の文字コードから判断する。文字種別格納手段5は文字の並びに文字の並びの各文字の文字種別を付加した情報を格納する。キーワード抽出手段6は文字の並びの各文字とその文字の文字種別とから、隣り合う文字種別が異なっている文字を検出して文字の並びを文字種別毎に区切ってキーワードを抽出し、それにひらがなが連続する場合にそのひらがなの文字も対応付けて出力する。
Claim (excerpt):
キーワード検索の対象となる日本語文書を1文字ずつ分解して文字の並びとする文字分解手段と、前記文字の並びの各文字の文字種別を判断する文字種別判断手段と、前記文字の並びの各文字に前記文字種別判断手段の判断結果を付加して格納する文字種別格納手段と、前記文字種別格納手段の格納内容から隣り合う文字種別が異なっている文字の並びをキーワードとして抽出しかつ前記キーワードとそのキーワードの後に連続するひらがなの文字とを対応付けて出力するキーワード抽出手段とを有することを特徴とするキーワード抽出装置。
IPC (2):
G06F 17/30 ,  G06F 17/27
FI (2):
G06F 15/401 310 A ,  G06F 15/20 550 F
Patent cited by the Patent:
Cited by examiner (3)

Return to Previous Page