特許
J-GLOBAL ID:200903082952711174

因果関係知識抽出装置及びプログラム

発明者:
出願人/特許権者:
代理人 (3件): 杉村 興作 ,  藤谷 史朗 ,  来間 清志
公報種別:公開公報
出願番号(国際出願番号):特願2006-041281
公開番号(公開出願番号):特開2007-219947
出願日: 2006年02月17日
公開日(公表日): 2007年08月30日
要約:
【課題】手掛かり語が出現しない場合や、並列語中の動詞が共通の目的語を持たない場合であっても、名詞間(名詞ペア)における因果関係を抽出することが可能な因果関係知識抽出装置及びプログラムを提供する。【解決手段】名詞ペア抽出部2がテキストデータから名詞ペアを抽出し、特徴抽出部3が、その名詞ペアを含むテキストデータの構文構造の特徴及び名詞ペアの属性の特徴を抽出して3項組を生成する。そして、タグ付け部4により、因果関係の有無が示されていない教師無しデータ、及び因果関係の有無が示された教師有りデータが格納される。機械学習部5は、前記格納されたデータを用いて因果関係について判定し、その結果を格納する。また、テキスト解析インターフェース部6は、テキスト解析の対象となるテキストデータについて、前記結果データに基づいて名詞ペアにおける因果関係の有無を判定する。【選択図】図1
請求項(抜粋):
テキストデータに含まれる名詞ペアについて、その因果関係の有無を知識として抽出する装置であって、 テキストデータに含まれる名詞ペアを抽出する名詞ペア抽出部と、 該名詞ペア抽出部により抽出された名詞ペアを含むテキストデータについて、該テキストデータの構文構造及び前記名詞ペアの属性を特徴データとして抽出する特徴抽出部と、 該特徴抽出部により抽出された特徴データの一部に対し、前記名詞ペアにおける因果関係の有無をタグとして付与するタグ付け部と、 該タグ付け部によりタグが付与された特徴データが教師有りデータとして格納され、タグ付け部によりタグが付与されない特徴データが教師無しデータとして格納される記憶部と、 該記憶部に格納された教師有りデータ及び教師無しデータに基づいて、該教師無しデータに含まれる名詞ペアにおける因果関係の有無を判定する因果関係判定部と、を備えたことを特徴とする因果関係知識抽出装置。
IPC (2件):
G06F 17/28 ,  G06F 17/30
FI (2件):
G06F17/28 U ,  G06F17/30 220Z
Fターム (8件):
5B075ND03 ,  5B075ND35 ,  5B091AA15 ,  5B091CA12 ,  5B091CC04 ,  5B091CC16 ,  5B091EA01 ,  5B091EA02
引用文献:
前のページに戻る