特許
J-GLOBAL ID:200903078810866319

情報抽出のための一般化文字列パターンの学習および使用

発明者:
出願人/特許権者:
代理人 (2件): 谷 義一 ,  阿部 和夫
公報種別:公開公報
出願番号(国際出願番号):特願2004-354479
公開番号(公開出願番号):特開2005-174336
出願日: 2004年12月07日
公開日(公表日): 2005年06月30日
要約:
【課題】 本発明は、情報源から情報を抽出することに関する。【解決手段】 抽出時に、情報源の中の文字列がアクセスされる。情報源に含まれるこれらの文字列と、単語およびワイルドカードを含む一般化された抽出パターンとの照合が行われる。ワイルドカードは、個々の文字列と個々の一般化された抽出パターンとの照合のため個々の文字列の中の少なくとも1つの単語をスキップできることを表す。【選択図】 図3
請求項(抜粋):
情報源から情報を抽出するコンピュータに実装された方法であって、 前記情報源内の文字列にアクセスすることと、 前記情報源に含まれる前記文字列と一般化された抽出パターンとを比較し、少なくとも1つの一般化された抽出パターンと照合する前記情報源の中の文字列を識別することであって、前記一般化された抽出パターンは、単語およびワイルドカードを含み、前記ワイルドカードは、個々の文字列と個々の一般化された抽出パターンとの照合を行うために前記個々の文字列の中の少なくとも1つの単語をスキップできることを表すこととを備えたことを特徴とするコンピュータに実装された方法。
IPC (1件):
G06F17/30
FI (3件):
G06F17/30 350C ,  G06F17/30 170A ,  G06F17/30 340B
Fターム (3件):
5B075ND03 ,  5B075PR03 ,  5B075QM06

前のページに戻る