特許
J-GLOBAL ID:200903088783405440

情報抽出方法及び装置及び情報抽出プログラムを格納した記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願平11-006202
公開番号(公開出願番号):特開2000-207407
出願日: 1999年01月13日
公開日(公表日): 2000年07月28日
要約:
【要約】【課題】 多様な対象分野における文書に対し、文書の分野及び利用者の目的・要求に応じた柔軟な情報抽出を行うことが可能な情報抽出方法及び装置及び情報抽出プログラムを格納した記憶媒体を提供する。【解決手段】 本発明は、個々の文書中に出現する単語を、語彙間の意味的関係を体系化した辞書であるオントロジ辞書上に記述された、抽出すべき情報の要素となる単語である抽出対象語に読み替えて、格納し、文書中に認識された抽出対象語をオントロジ辞書上に記述された語彙間の意味的関係を用いて、該文書中に出現しない関係を補足しつつ、該オントロジ辞書中で利用者の興味を端的に示す指標である中心語に対する単語関係列へと展開し、得られた該単語関係列を格納し、個々の単語関係列を、部分的な単語の関係や記事全体の語の用いられ方に基づいて、属性名と属性値からなる関係に変換し、得られた関係を格納する。
請求項(抜粋):
文書情報から情報抽出する情報抽出方法において、個々の文書中に出現する単語を、語彙間の意味的関係を体系化した辞書であるオントロジ辞書上に記述された、抽出すべき情報の要素となる単語である抽出対象語に読み替えて、格納し、前記文書中に認識された前記抽出対象語を前記オントロジ辞書上に記述された語彙間の意味的関係を用いて、該文書中に出現しない関係を補足しつつ、該オントロジ辞書中で利用者の興味を端的に示す指標である中心語に対する単語関係列へと展開し、得られた該単語関係列を格納し、個々の前記単語関係列を、部分的な単語の関係や記事全体の語の用いられ方に基づいて、属性名と属性値からなる関係に変換し、得られた関係を格納することを特徴とする情報抽出方法。
FI (2件):
G06F 15/401 320 A ,  G06F 15/40 370 A
Fターム (6件):
5B075ND03 ,  5B075NK34 ,  5B075NK43 ,  5B075NR06 ,  5B075NR12 ,  5B075PQ05

前のページに戻る