特許
J-GLOBAL ID:200903040462484116

文章分類装置および方法

発明者:
出願人/特許権者:
代理人 (1件): 山川 政樹
公報種別:公開公報
出願番号(国際出願番号):特願2004-053419
公開番号(公開出願番号):特開2005-038386
出願日: 2004年02月27日
公開日(公表日): 2005年02月10日
要約:
【課題】 比較的少ない作業負担で、主観にとらわれることなく柔軟に分類できるようにする。【解決手段】 DTマトリクス生成手段11で、文章集合21内の各文章Dとタームリスト22内の各タームTとからDTマトリクス11Aを生成し、DTマトリクス変形手段12で、そのDTマトリクス11AをDM分解して変形DTマトリクス11Bを生成する。そして文章分類手段13で、変形DTマトリクス11B上に現れる各クラスタごとに、当該クラスタに属する各文章Dを1つの分類(部分集合)として抽出出力する。【選択図】 図1
請求項(抜粋):
文章集合に含まれる複数の文章を、1つ以上の単語からなるタームを複数有するタームリストに基づき分類する文章分類装置において、 前記各文章と前記各タームとの関係を2次元表現したDTマトリクスを生成するDTマトリクス生成手段と、 グラフ理論で用いられるDM分解法に基づいて前記DTマトリクス生成手段で得られたDTマトリクスを変形することにより、変形DTマトリクスを生成するDTマトリクス変形手段と、 このDTマトリクス変形手段で得られた変形DTマトリクス上でブロック化されたクラスタごとに、当該クラスタに属する文章を同一分類として出力する文章分類手段とを備えることを特徴とする文章分類装置。
IPC (2件):
G06F17/30 ,  G06F17/21
FI (4件):
G06F17/30 210D ,  G06F17/30 170A ,  G06F17/30 220Z ,  G06F17/21 550A
Fターム (8件):
5B009QA02 ,  5B009QA05 ,  5B009QA06 ,  5B009QA11 ,  5B075ND03 ,  5B075NR12 ,  5B075NS10 ,  5B075UU06
引用文献:
前のページに戻る