特許
J-GLOBAL ID:201403046189986357
文書検索システム、文書検索方法
発明者:
出願人/特許権者:
,
代理人 (1件):
酒井 宏明
公報種別:特許公報
出願番号(国際出願番号):特願2012-005225
公開番号(公開出願番号):特開2013-145448
特許番号:特許第5364802号
出願日: 2012年01月13日
公開日(公表日): 2013年07月25日
請求項(抜粋):
【請求項1】 検索対象となる文書を登録する文書登録装置と、入力された検索用キーワードと一致する文書を検索する文書検索装置と、を備える文書検索システムであって、
前記文書登録装置は、
前記文書から語彙を切り出す語彙切り出し部と、
切り出された前記語彙と、当該語彙が含まれる文書とを対応付けて索引辞書に記憶する索引化部と、
一の語彙に対して、同一の文書内に出現して共起関係にある他の語彙を対応付けた共起情報を共起辞書に記憶する共起辞書生成部と、
前記共起辞書のサイズが所定の最大サイズより大きい場合に、グループ化される前記語彙の文書中における出現頻度の合計値が所定の最大出現頻度以下となるよう前記共起辞書に記憶された複数の語彙を同一の語彙グループに対応付けグループ辞書に記憶するグループ化処理を実行するグループ化部と、
を備え、
前記共起辞書生成部は、当該語彙グループに含まれる語彙と共起関係にある語彙と前記語彙グループとを対応付けた共起情報を前記共起辞書に記憶するとともに、当該語彙グループに対応付けられた語彙の前記共起情報を前記共起辞書から削除し、
前記文書検索装置は、
入力された検索用キーワードを受け付ける入力中キーワード受信部と、
前記入力中キーワード受信部で受け付けた前記検索用キーワードと共起する前記語彙または前記語彙グループを前記共起辞書から取得する共起語彙取得部と、
前記語彙グループが取得された場合は、前記グループ辞書から当該語彙グループに含まれる前記語彙を取得するとともに、取得した前記語彙と、前記検索用キーワードとの同一文書中における出現回数である共起頻度を前記索引辞書を用いて算出し、当該共起頻度から前記検索用キーワードと前記共起関係にあると判断される前記語彙を取得する共起グループ処理部と、
前記共起語彙取得部、及び前記共起グループ処理部が取得した前記語彙を前記検索用キーワードに対する関連キーワードとして提示する共起語彙提示部と
を備えることを特徴とする文書検索システム。
IPC (1件):
FI (3件):
G06F 17/30 320 D
, G06F 17/30 170 A
, G06F 17/30 310 A
引用特許:
出願人引用 (3件)
-
検索提案のクラスタ化及び提示
公報種別:公表公報
出願番号:特願2012-547119
出願人:ヤフー!インコーポレイテッド
-
関連語辞書作成装置
公報種別:公開公報
出願番号:特願平6-321208
出願人:富士ゼロックス株式会社
-
仕様設定支援装置
公報種別:公開公報
出願番号:特願平11-161117
出願人:トヨタ自動車株式会社
前のページに戻る