特許
J-GLOBAL ID:200903091884697183

テキストマイニング処理方法及びその実施装置

発明者:
出願人/特許権者:
代理人 (1件): 秋田 収喜
公報種別:公開公報
出願番号(国際出願番号):特願2001-341474
公開番号(公開出願番号):特開2003-141134
出願日: 2001年11月07日
公開日(公表日): 2003年05月16日
要約:
【要約】【課題】 ユーザの望む解像度のテキストマイニング結果を得る為のテキストマイニング処理を効率的に支援することが可能な技術を提供する。【解決手段】 予め登録された文書の集合を対象としてその文書集合に関する各種情報を取得するテキストマイニング処理方法において、予め登録された文書の集合を対象として、その全体または一部分を取り出した処理対象文書集合に特徴的に出現する語句を抽出するステップと、処理対象文書の細分化を行う基準となる区分によって構成される分析軸を設定するステップと、前記設定された分析軸を構成する各区分と関連する度合が高い関連語句を前記抽出した語句の中から取得するステップと、前記取得した関連語句の文書集合における出現偏りしきい値をユーザから受付けて設定するステップと、前記設定された出現偏りしきい値よりも大きい出現偏り値を持つ関連語句のみを前記取得した関連語句から抽出してテキストマイニング結果とするステップとを有するものである。
請求項(抜粋):
予め登録された文書の集合を対象としてその文書集合に関する各種情報を取得するテキストマイニング処理方法において、予め登録された文書の集合を対象として、その全体または一部分を取り出した処理対象文書集合に特徴的に出現する語句を抽出するステップと、処理対象文書の細分化を行う基準となる区分によって構成される分析軸を設定するステップと、前記設定された分析軸を構成する各区分と関連する度合が高い関連語句を前記抽出した語句の中から取得するステップと、前記取得した関連語句の文書集合における出現偏りしきい値をユーザから受付けて設定するステップと、前記設定された出現偏りしきい値よりも大きい出現偏り値を持つ関連語句のみを前記取得した関連語句から抽出してテキストマイニング結果とするステップとを有することを特徴とするテキストマイニング処理方法。
IPC (2件):
G06F 17/30 220 ,  G06F 17/30 170
FI (2件):
G06F 17/30 220 Z ,  G06F 17/30 170 A
Fターム (2件):
5B075ND02 ,  5B075NS10

前のページに戻る