特許
J-GLOBAL ID:200903037030007782

文書検索装置及びプログラム

発明者:
出願人/特許権者:
代理人 (8件): 鈴江 武彦 ,  河野 哲 ,  中村 誠 ,  蔵田 昌俊 ,  峰 隆司 ,  福原 淑弘 ,  村松 貞男 ,  橋本 良郎
公報種別:公開公報
出願番号(国際出願番号):特願2007-036791
公開番号(公開出願番号):特開2008-203997
出願日: 2007年02月16日
公開日(公表日): 2008年09月04日
要約:
【課題】人手によるメンテナンスが必要なデータを用いることなく多義語の解消を行う。【解決手段】共起情報ファイル44は複数の単語間の共起関係を表す共起情報を記憶する。コンテキスト特定部53は、ユーザからの検索要求で指定された検索条件に含まれている検索の対象となる検索対象単語と共起情報ファイル44に記憶されている共起情報とを照合することにより、共起関係のある検索対象単語の組を共起単語グループとして抽出する。単語展開結果ファイル45は、検索対象単語の類義語または関連語への単語展開がなされた過去の単語展開結果を記憶する。単語展開部54は、抽出された共起単語グループを含む単語展開結果を単語展開結果ファイル45から取得して、上記検索要求で指定された検索条件に含まれている検索対象単語を、当該単語展開結果を含むように展開する。類似文書検索部55は、新たな単語展開結果に基づいて文書検索を行う。【選択図】 図2
請求項(抜粋):
文書データベースから検索条件に合致する文書を検索する文書検索装置において、 複数の単語間の共起関係を表す共起情報を記憶する共起情報記憶手段と、 ユーザからの検索要求を受け付ける要求受け付け手段と、 前記検索要求で指定された検索条件に含まれている検索の対象となる検索対象単語と前記共起情報記憶手段に記憶されている共起情報とを照合することにより、共起関係のある検索対象単語の組を共起単語グループとして抽出する共起単語グループ抽出手段と、 検索対象単語の類義語または関連語への単語展開がなされた過去の単語展開結果を記憶する単語展開結果記憶手段と、 前記共起単語グループ抽出手段によって抽出された共起単語グループを含む単語展開結果を前記単語展開結果記憶手段から取得して、前記検索要求で指定された検索条件に含まれている検索対象単語を、当該単語展開結果を含むように展開する単語展開手段と、 前記単語展開手段によって展開された新たな単語展開結果を拡張された検索条件として、当該新たな単語展開結果に基づいて前記データベースから文書を検索する検索手段と を具備することを特徴とする文書検索装置。
IPC (1件):
G06F 17/30
FI (3件):
G06F17/30 320D ,  G06F17/30 170A ,  G06F17/30 340B
Fターム (3件):
5B075ND03 ,  5B075NK35 ,  5B075PR03
引用特許:
出願人引用 (2件) 審査官引用 (4件)
全件表示

前のページに戻る