特許
J-GLOBAL ID:200903052727069980

文書依存関係抽出装置および方法

発明者:
出願人/特許権者:
代理人 (3件): 澤田 俊夫 ,  宮田 正昭 ,  山田 英治
公報種別:公開公報
出願番号(国際出願番号):特願2002-169236
公開番号(公開出願番号):特開2004-013745
出願日: 2002年06月10日
公開日(公表日): 2004年01月15日
要約:
【課題】文書間の依存関係を抽出する。【解決手段】定義属性付与部11は文書群の各文書に対して定義属性の付与を行う。例えば、形態素解析を行い単語に分割し、「〜とは-である」等の言語パタンで抽出された「〜」に相当する単語等に「定義属性」を与える。定義属性付与部11は抽出した定義属性を持つ単語と、与えられた元の文書とを、参照属性付与部12に渡す。参照属性付与部12は受け取った定義属性を持つ単語と同じ文字ストリングで定義属性を持たない単語が元の6つの文書にあるか否かを調べる。あった場合はその単語に参照属性を付与する。依存リンク生成部13は、参照属性を持つ単語から、定義属性をもつ同じ字面の単語へリンクを貼り、このリンクを量的に評価して文書間の依存度を生成し、依存リンク保存部14を介して依存リンクデータベース15へ保存する。【選択図】 図1
請求項(抜粋):
それぞれ1塊の文書として他の文書と区別して扱うことができる複数の文書単位を記憶する文書記憶手段と、 上記文書記憶手段に記憶された各文書単位において、単語が定義を伴って出現したことを判別する第1の判別手段と、 上記文書記憶手段に記憶された各文書単位において、上記第1の判別手段により定義を伴って出現したと判別された単語が定義を伴うことなく出現したことを判別する第2の判別手段と、 定義を伴って出現した単語と、当該単語に対応し定義を伴うことなく出現した単語との対応関係に基づいて、上記定義を伴って出現した単語が判別された文書単位と、上記当該単語に対応し定義を伴うことなく出現した単語が判別された文書単位との依存関係を決定する依存関係決定手段とを有することを特徴とする文書依存関係抽出装置。
IPC (2件):
G06F17/30 ,  G06F17/21
FI (6件):
G06F17/30 220Z ,  G06F17/30 170A ,  G06F17/30 360Z ,  G06F17/30 419B ,  G06F17/21 550A ,  G06F17/21 570D
Fターム (11件):
5B009QA03 ,  5B009QA09 ,  5B009QA12 ,  5B009SA03 ,  5B009SA12 ,  5B009SA14 ,  5B075ND03 ,  5B075ND36 ,  5B075NS10 ,  5B075PQ02 ,  5B075PQ13

前のページに戻る