特許
J-GLOBAL ID:200903062451108213

文章分類装置、文章分類方法、およびプログラム

発明者:
出願人/特許権者:
代理人 (2件): 山川 政樹 ,  山川 茂樹
公報種別:公開公報
出願番号(国際出願番号):特願2005-180362
公開番号(公開出願番号):特開2007-004233
出願日: 2005年06月21日
公開日(公表日): 2007年01月11日
要約:
【課題】各文章の重要性や文章同士の関係性を自動的に可視化する。【解決手段】大分類生成手段3は、クラスタリンク処理を繰り返し実行することにより変形DTマトリクス24を順次生成し、変形DTマトリクス24上のクラスタごとに少なくとも当該クラスタを構成する文章に関する情報を大分類データ25として出力し、表示処理手段16は、大分類データ25に基づいて各クラスタリング処理で生成された各クラスタを示すクラスタシンボルと各クラスタ間の統合関係を示すリンクシンボルとを用いた木構造で大分類の結果を画面表示する。【選択図】 図1
請求項(抜粋):
複数の文章からなる文章集合と1つ以上の単語からなるタームを複数有するタームリストとを含む各種処理情報を記憶する記憶部と、前記処理情報に対して任意の情報演算処理を行う演算処理部と、この演算処理部での処理結果を画面表示する画面表示部とを有し、前記演算処理部により、前記各文章を前記タームリストに基づき分類する文章分類装置であって、 前記演算処理部は、 前記各文章と前記各タームとの関係を2次元表現したDTマトリクスを生成するDTマトリクス生成手段と、 グラフ理論で用いられるDM分解法に基づいて前記DTマトリクス生成手段で得られたDTマトリクスを変形することにより、変形DTマトリクスを生成するDTマトリクス変形手段と、 変形DTマトリクス上でブロック化されたクラスタごとに、当該クラスタに属する各文章のタームから仮想代表文章を生成する仮想代表生成手段と、 前記DTマトリクス生成手段で生成したDTマトリクスを初期状態として用い、所定のクラスタリング処理をステップとして繰り返し行うことにより前記文章の大分類を生成する大分類生成手段と、 前記大分類の大分類を前記画面表示部で画面表示する表示処理手段とを備え、 前記大分類生成手段は、前記クラスタリング処理として、前記DTマトリクス変形手段でDTマトリクスから生成された変形DTマトリクス上のクラスタごとに前記仮想代表生成手段で仮想代表文章を生成し、前記仮想代表文章を当該変形DTマトリクスに追加するとともに前記仮想代表文章のクラスタに属する文章を当該変形DTマトリクスから削除して次のクラスタリング処理に用いる新たなDTマトリクスを生成し、前記クラスタごとに少なくとも当該クラスタを構成する文章に関する情報を大分類データとして出力し、 前記表示処理手段は、前記大分類データに基づいて、前記各クラスタリング処理で生成された各クラスタを示すクラスタシンボルと前記各クラスタ間の統合関係を示すリンクシンボルとを用いた木構造で前記大分類の結果を画面表示する ことを特徴とする文章分類装置。
IPC (2件):
G06N 3/00 ,  G06F 17/30
FI (4件):
G06N3/00 560J ,  G06F17/30 170A ,  G06F17/30 210D ,  G06F17/30 360Z
Fターム (9件):
5B075ND03 ,  5B075NK02 ,  5B075NK44 ,  5B075NR02 ,  5B075NR12 ,  5B075PQ13 ,  5B075PQ74 ,  5B075QP01 ,  5B075UU06
引用特許:
出願人引用 (1件) 審査官引用 (3件)

前のページに戻る