特許
J-GLOBAL ID:200903065017059726
情報処理装置および情報処理方法、並びに情報処理プログラム
発明者:
,
出願人/特許権者:
,
代理人 (1件):
堀 城之
公報種別:公開公報
出願番号(国際出願番号):特願2002-360352
公開番号(公開出願番号):特開2004-192398
出願日: 2002年12月12日
公開日(公表日): 2004年07月08日
要約:
【課題】テキストデータの特徴を検出し、テキストデータに隠れている潜在的な意味を類推することができるようにする。【解決手段】入力部1から入力されたテキストデータに対して、ワードカッティング部3がワードカッティング処理し、構文解析部4が構文解析し、その結果からシソーラス作成部5がシソーラスを作成し、再ワードカッティング・構文解析後、シソーラス仕分け部7が仕分けし、出現頻度算出部がシソーラスの出現頻度を算出し、相関係数算出部11がシソーラス間の相関係数を算出し、シソーラス毎の相関係数合計算出部13がシソーラス毎の相関係数の合計を算出し、グラフ作成表示部15が出現頻度とシソーラス毎の相関係数の合計に基づいてグラフを作成する。【選択図】 図1
請求項(抜粋):
テキストデータを入力する入力手段と、
前記テキストデータを記憶するテキストデータ記憶手段と、
前記テキストデータに対してワードカッティング処理を実行するワードカッティング手段と、
前記ワードカッティング処理が行われた前記テキストデータに対して構文解析処理を行う構文解析手段と、
前記構文解析処理が行われた前記テキストデータからシソーラスを作成するシソーラス作成手段と、
前記シソーラス作成手段によって作成された前記シソーラスを記憶するシソーラス記憶手段と、
前記ワードカッティングおよび前記構文解析が行われた前記テキストデータに対して仕分け処理を行うシソーラス仕分け手段と、
前記シソーラス仕分け手段による仕分け結果を記憶する仕分け結果記憶手段と、
前記仕分け結果記憶手段によって記憶されている前記仕分け結果に基づいて、各シソーラス毎に出現頻度を算出する出現頻度算出手段と、
前記出現頻度算出手段によって算出された結果を記憶する出現頻度記憶手段と、
シソーラス間の相関係数を算出する相関係数算出手段と、
相関係数算出手段によって算出されたシソーラス間の相関係数を記憶する相関係数記憶手段と、
シソーラス毎の相関係数の合計を算出するシソーラス毎の相関係数合計算出手段と、
シソーラス毎の相関係数合計算出手段によって算出されたシソーラス毎の相関係数の合計を記憶するシソーラス毎の相関係数合計記憶手段と、
出現頻度記憶手段によって記憶されている出現頻度と、シソーラス毎の相関係数合計記憶手段によって記憶されているシソーラス毎の相関係数合計とに基づいて、グラフを作成し、表示するグラフ作成表示手段と
を備え、
前記ワードカッティング手段および前記構文解析手段は、前記シソーラス作成手段によって作成された前記シソーラスに基づいて再度ワードカッティング処理および構文解析処理を行う
ことを特徴とする情報処理装置。
IPC (1件):
FI (5件):
G06F17/30 360Z
, G06F17/30 170A
, G06F17/30 210A
, G06F17/30 220Z
, G06F17/30 340B
Fターム (9件):
5B075ND03
, 5B075NK02
, 5B075NK32
, 5B075NK35
, 5B075NS02
, 5B075PQ02
, 5B075PQ14
, 5B075PR04
, 5B075QP03
引用特許:
前のページに戻る