特許
J-GLOBAL ID:200903001697096509
関係情報抽出方法及び意味情報抽出方法
発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願2001-086646
公開番号(公開出願番号):特開2002-288166
出願日: 2001年03月26日
公開日(公表日): 2002年10月04日
要約:
【要約】【課題】 文書中から抽出された意味属性や関係の情報を、文書が作成された年月日などの時間情報とともに格納することで、抽出された結果に対する信頼度情報の提供や絞り込みによって、より正確な情報抽出技術を提供する。【解決手段】 関係表現パターン辞書、あるいは意味属性パターン辞書に記述のパターンを順に照合する(S1)。文書中の未照合の位置から語を照合する(S2)。パターンと一致した語の並びがあれば(S3)、それらを抽出し、指定の順で格納する(S4)。さらに格納された情報に、文書の時間に関する情報(文書の作成日や発行日等の時間に関する情報)を共に格納する(S5)。文書中のすべての語について照合が終了すると(S6)、次のパターンについて同様に照合を行なう(S1)。文書に関する時間の情報の抽出自体は、文書の書誌情報やヘッダの情報から抽出する。
請求項(抜粋):
語と語の関係を表す関係表現と、関係表現と共に出現する語と、その順序を規定した関係表現パターン辞書とを有し、文書中から、語と、語の関係を抽出し、文書の作成に関する時間の情報とを対応付けて格納することを特徴とする関係情報抽出方法。
IPC (5件):
G06F 17/27
, G06F 17/21 550
, G06F 17/21 590
, G06F 17/30 170
, G06F 17/30 330
FI (5件):
G06F 17/27 Z
, G06F 17/21 550 A
, G06F 17/21 590 J
, G06F 17/30 170 J
, G06F 17/30 330 C
Fターム (12件):
5B009QA09
, 5B009VA02
, 5B009VA05
, 5B009VA09
, 5B075ND03
, 5B075ND20
, 5B075NK32
, 5B075NR03
, 5B075UU02
, 5B075UU08
, 5B091CA12
, 5B091CC04
引用特許:
前のページに戻る