特許
J-GLOBAL ID:200903087691355547

文書検索処理方法、文書検索システムおよび質問応答システム

発明者:
出願人/特許権者:
代理人 (2件): 重久 啓子 ,  福井 國敞
公報種別:公開公報
出願番号(国際出願番号):特願2002-292962
公開番号(公開出願番号):特開2004-127131
出願日: 2002年10月04日
公開日(公表日): 2004年04月22日
要約:
【課題】電子化された文書群から効率的にかつ高精度に文書検索できる文書検索処理方法を提供する。【解決手段】文書検索システムでは、キーワード入力部11はキーワード群を入力し、文書取り込み部12は文書データベース2から文書を1つずつ取り込み、評価スコア算出部13は、各文書で領域を仮定し、その領域にキーワードが出現する確率を求め、この確率をもとにキーワード群の出現パターンの出現確率を算出し、出現確率が小さいほど評価が良いと判断して文書に評価スコアを付与する。出力文書抽出部14は、評価スコアが上位の文書を抽出し、出力整形部15は、抽出された文書を所定の形式に変形して検索結果として出力する。【選択図】 図1
請求項(抜粋):
コンピュータにより、電子化された文書群を複数のキーワードで照合し適合する文書を抽出する文書検索処理方法であって、 文書群の各文書について、前記文書中にキーワードが出現する頻度およびキーワードの出現の近接度にもとづいて前記キーワードの出現パターンの出現確率を算出し、 前記出現確率が小さいほど前記キーワードとの関連性が高い文書であると判断して、前記出現確率にもとづく評価スコアを前記文書に付与し、 前記評価スコアをもとに前記文書群から文書を抽出する ことを特徴とする文書検索処理方法。
IPC (1件):
G06F17/30
FI (3件):
G06F17/30 350C ,  G06F17/30 170A ,  G06F17/30 340B
Fターム (11件):
5B075ND03 ,  5B075NK02 ,  5B075NK32 ,  5B075PP22 ,  5B075PP24 ,  5B075PP25 ,  5B075PQ36 ,  5B075PQ74 ,  5B075PR04 ,  5B075PR06 ,  5B075QM08

前のページに戻る