Pat
J-GLOBAL ID:200903082952711174

因果関係知識抽出装置及びプログラム

Inventor:
Applicant, Patent owner:
Agent (3): 杉村 興作 ,  藤谷 史朗 ,  来間 清志
Gazette classification:公開公報
Application number (International application number):2006041281
Publication number (International publication number):2007219947
Application date: Feb. 17, 2006
Publication date: Aug. 30, 2007
Summary:
【課題】手掛かり語が出現しない場合や、並列語中の動詞が共通の目的語を持たない場合であっても、名詞間(名詞ペア)における因果関係を抽出することが可能な因果関係知識抽出装置及びプログラムを提供する。【解決手段】名詞ペア抽出部2がテキストデータから名詞ペアを抽出し、特徴抽出部3が、その名詞ペアを含むテキストデータの構文構造の特徴及び名詞ペアの属性の特徴を抽出して3項組を生成する。そして、タグ付け部4により、因果関係の有無が示されていない教師無しデータ、及び因果関係の有無が示された教師有りデータが格納される。機械学習部5は、前記格納されたデータを用いて因果関係について判定し、その結果を格納する。また、テキスト解析インターフェース部6は、テキスト解析の対象となるテキストデータについて、前記結果データに基づいて名詞ペアにおける因果関係の有無を判定する。【選択図】図1
Claim (excerpt):
テキストデータに含まれる名詞ペアについて、その因果関係の有無を知識として抽出する装置であって、 テキストデータに含まれる名詞ペアを抽出する名詞ペア抽出部と、 該名詞ペア抽出部により抽出された名詞ペアを含むテキストデータについて、該テキストデータの構文構造及び前記名詞ペアの属性を特徴データとして抽出する特徴抽出部と、 該特徴抽出部により抽出された特徴データの一部に対し、前記名詞ペアにおける因果関係の有無をタグとして付与するタグ付け部と、 該タグ付け部によりタグが付与された特徴データが教師有りデータとして格納され、タグ付け部によりタグが付与されない特徴データが教師無しデータとして格納される記憶部と、 該記憶部に格納された教師有りデータ及び教師無しデータに基づいて、該教師無しデータに含まれる名詞ペアにおける因果関係の有無を判定する因果関係判定部と、を備えたことを特徴とする因果関係知識抽出装置。
IPC (2):
G06F 17/28 ,  G06F 17/30
FI (2):
G06F17/28 U ,  G06F17/30 220Z
F-Term (8):
5B075ND03 ,  5B075ND35 ,  5B091AA15 ,  5B091CA12 ,  5B091CC04 ,  5B091CC16 ,  5B091EA01 ,  5B091EA02
Article cited by the Patent:
Return to Previous Page