特許
J-GLOBAL ID:200903023603920916
二項関係抽出装置,二項関係抽出処理を用いた情報検索装置,二項関係抽出処理方法,二項関係抽出処理を用いた情報検索処理方法,二項関係抽出処理プログラム,および二項関係抽出処理を用いた情報検索処理プログラム
発明者:
,
,
,
出願人/特許権者:
,
,
代理人 (2件):
重久 啓子
, 渡部 章彦
公報種別:公開公報
出願番号(国際出願番号):特願2005-183495
公開番号(公開出願番号):特開2007-004458
出願日: 2005年06月23日
公開日(公表日): 2007年01月11日
要約:
【課題】 複雑な問題についても性能よく二項関係を抽出できる装置を提供する。【解決手段】 解-素性対抽出部12は,テキストデータに出現する二項関係に,抽出するべきものを示す解が付与された事例を含む教師データが格納された教師データ記憶部11から,事例の素性を抽出して素性の集合と解との組を生成する。機械学習部13は,所定の機械学習手法によって,その組が,どのような素性の集合の場合にどのような解となるかということを機械学習し学習結果情報を学習結果記憶部14に保存する。候補抽出部15は,テキストデータ2から二項関係の候補を抽出し,素性抽出部16は,二項関係の候補の素性の集合を抽出する。解推定部17は,学習結果情報をもとに,二項関係の候補の素性の集合の場合の解となりやすさの度合いを推定し,二項関係抽出部18は,推定結果から正の解の推定の程度が良い二項関係の候補を抽出する。【選択図】 図1
請求項(抜粋):
コンピュータが読み取り可能な記憶装置に格納された文データ中に出現する二項関係を,機械学習処理を用いて抽出する処理装置であって,
問題と解との組で構成される事例であって,問題が文データ中に出現する二項関係であって解が抽出するべき二項関係であるものを含む教師データが格納された教師データ記憶手段と,
前記教師データ記憶手段から前記事例を取り出し,前記事例ごとに,所定の情報を素性として抽出し,前記解と前記抽出した素性の集合との組を生成する解-素性対抽出手段と,
所定の機械学習アルゴリズムにもとづいて,前記解と素性の集合との組について,どのような素性の集合の場合に前記解となるかということを機械学習処理し,前記どのような素性の集合の場合に前記解となるかということを示す情報を学習結果情報として学習結果記憶手段に保存する機械学習手段と,
前記記憶装置に格納されたテキストデータから,前記二項関係の要素を抽出し,前記要素で構成される対を抽出し,前記抽出した対を二項関係の候補とする候補抽出手段と,
前記解-素性対抽出手段が行う抽出処理と同様の抽出処理によって,前記二項関係の候補について前記所定の情報を素性として抽出する素性抽出手段と,
前記学習結果記憶手段に格納された前記学習結果情報にもとづいて,前記二項関係の候補の素性の集合の場合の前記解となりやすい度合いを推定する解推定手段と,
前記推定結果として,前記二項関係の候補について抽出するべき二項関係であることを示す解となりやすい度合いが所定の程度より良い場合に,前記二項関係の候補を抽出するべき二項関係として選択する二項関係抽出手段とを備える
ことを特徴とする二項関係抽出装置。
IPC (1件):
FI (3件):
G06F17/30 220Z
, G06F17/30 170A
, G06F17/30 180A
Fターム (3件):
5B075ND03
, 5B075PP22
, 5B075QP01
引用特許:
引用文献:
前のページに戻る