特許
J-GLOBAL ID:200903003941777532

関連語抽出装置、関連語抽出方法及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 外川 英明
公報種別:公開公報
出願番号(国際出願番号):特願2003-155922
公開番号(公開出願番号):特開2004-361992
出願日: 2003年05月30日
公開日(公表日): 2004年12月24日
要約:
【課題】ある分野の関連語を抽出するときに、他の分野の文書が用意できず、また、必ずしも関連語が一つの文書内に共起していない場合であっても、適切に関連語を抽出する。【解決手段】対象分野取得部512は、入力装置3により入力された対象分野を対象分野格納バッファ521に格納する。文書読み出し部514は、文書データベース601内の文書を読み出し、対象分野取得部512が取得した対象分野と一致する分野情報を有する文書を探索する。一致した分野情報を有する文書が分野一時格納バッファ525に格納され、この格納された文書に対して形態素解析が実行される。分野情報を有する文書の修辞表現に着目した所定の分野関連単語表記パターンを参照し、上記形態素解析の結果から関連語が集計抽出される。必要に応じ、閾値を用いて出現頻度の低い関連語を除去してもよい。【選択図】 図5
請求項(抜粋):
複数の文書を有する文書データベースと、 文書の分野情報を入力する入力手段と、 前記入力された分野情報と一致する分野情報を有する文書を前記文書データベースから抽出する文書抽出手段と、 前記文書抽出手段により抽出された文書を自然言語解析する自然言語解析手段と、 前記文書データベース中の文書からこの文書の分野に関連する分野関連単語を抽出するための分野関連単語表記パターンを保持する分野関連単語表記パターン保持手段と、 前記自然言語解析の結果に基づいて前記分野関連単語表記パターンを参照し、前記文書データベースから抽出した文書から前記分野関連単語を抽出する分野関連単語抽出手段と、 前記抽出された分野関連単語の出現頻度を集計する分野関連単語集計手段と、 を具備することを特徴とする関連語抽出装置。
IPC (1件):
G06F17/30
FI (2件):
G06F17/30 320D ,  G06F17/30 170A
Fターム (1件):
5B075NK35

前のページに戻る