特許
J-GLOBAL ID:200903049656896579

個人関心事辞書作成装置

発明者:
出願人/特許権者:
代理人 (1件): 守山 辰雄
公報種別:公開公報
出願番号(国際出願番号):特願平9-364535
公開番号(公開出願番号):特開平11-184890
出願日: 1997年12月18日
公開日(公表日): 1999年07月09日
要約:
【要約】【課題】 個人が関心をもつ知識領域を表す語句(固有語)を当該個人が書いたテキストデータから抽出して、当該個人の関心事を把握するための辞書を作成する。【解決手段】 情報記憶手段1に記憶されている特定個人によって作成されたテキストデータを含む文書を、テキスト解析手段2で形態素解析等して語句の単位に切り分け、共起解析手段3によって、テキストデータ中の予め定めたテキスト単位中で固有名詞と共起する語を当該テキストデータを作成した特定個人の知識領域を表す抽象固有語候補として抽出し、更に、当該固有名詞を抽出して各抽象固有語との共起頻度をカウントする。そして、この固有名詞の共起頻度を基準として、抽象固有語抽出手段4で抽象固有語候補から抽象固有語を抽出し、更に、具体固有語抽出手段5により、抽出された抽象固有語と共起する固有名詞を、当該抽象固有語が表す領域での前記特定個人の具体的な関心を表す具体固有語として抽出し、これら抽出された抽象固有語と具体固有語とを対応付けて固有語辞書手段7に保持する。
請求項(抜粋):
文書中から当該文書を作成した特定個人の具体的な関心を表す語を抽出して、辞書にまとめる個人関心事辞書作成装置であって、特定個人によって作成されたテキストデータを含む文書を記憶する情報記憶手段と、前記文書中のテキストデータを解析するテキスト解析手段と、前記テキストデータ中の予め定めたテキスト単位中で固有名詞と共起する語を当該テキストデータを作成した特定個人の知識領域を表す抽象固有語候補として抽出し、更に、当該固有名詞を抽出して各抽象固有語との共起頻度をカウントする共起解析手段と、前記共起する固有名詞の共起頻度を基準として前記抽象固有語候補から抽象固有語を抽出する抽象固有語抽出手段と、前記抽出された抽象固有語と共起する固有名詞を、当該抽象固有語が表す領域での前記特定個人の具体的な関心を表す具体固有語として抽出する具体固有語抽出手段と、前記抽出された抽象固有語と具体固有語とを対応付けて保持する固有語辞書手段と、を備えたことを特徴とする個人関心事辞書作成装置。
IPC (2件):
G06F 17/30 ,  G06F 17/27
FI (2件):
G06F 15/401 320 A ,  G06F 15/38 D

前のページに戻る