特許
J-GLOBAL ID:200903035260147467

キーワード抽出装置

発明者:
出願人/特許権者:
代理人 (1件): ▲柳▼川 信
公報種別:公開公報
出願番号(国際出願番号):特願平8-165407
公開番号(公開出願番号):特開平10-011460
出願日: 1996年06月26日
公開日(公表日): 1998年01月16日
要約:
【要約】【課題】 文書中のキーワードを高速にかつその使われ方まで考慮して抽出可能とする。【解決手段】 文字分解手段2は文書格納手段1に格納された日本語文書を1文字ずつに分解して文字の並びとし、文字格納手段3に格納する。文字種別判断手段4は文字の並びの各文字の文字種別が漢字、カタカナ、英字、その他のいずれであるかをその文字の文字コードから判断する。文字種別格納手段5は文字の並びに文字の並びの各文字の文字種別を付加した情報を格納する。キーワード抽出手段6は文字の並びの各文字とその文字の文字種別とから、隣り合う文字種別が異なっている文字を検出して文字の並びを文字種別毎に区切ってキーワードを抽出し、それにひらがなが連続する場合にそのひらがなの文字も対応付けて出力する。
請求項(抜粋):
キーワード検索の対象となる日本語文書を1文字ずつ分解して文字の並びとする文字分解手段と、前記文字の並びの各文字の文字種別を判断する文字種別判断手段と、前記文字の並びの各文字に前記文字種別判断手段の判断結果を付加して格納する文字種別格納手段と、前記文字種別格納手段の格納内容から隣り合う文字種別が異なっている文字の並びをキーワードとして抽出しかつ前記キーワードとそのキーワードの後に連続するひらがなの文字とを対応付けて出力するキーワード抽出手段とを有することを特徴とするキーワード抽出装置。
IPC (2件):
G06F 17/30 ,  G06F 17/27
FI (2件):
G06F 15/401 310 A ,  G06F 15/20 550 F
引用特許:
審査官引用 (3件)

前のページに戻る