特許
J-GLOBAL ID:201703001618138504

文書分類装置、文書分類方法および文書分類プログラム

発明者:
出願人/特許権者:
代理人 (4件): 小林 博通 ,  鵜澤 英久 ,  山口 幸二 ,  橋本 剛
公報種別:特許公報
出願番号(国際出願番号):特願2013-216574
公開番号(公開出願番号):特開2015-079382
特許番号:特許第6040138号
出願日: 2013年10月17日
公開日(公表日): 2015年04月23日
請求項(抜粋):
【請求項1】 複数の文書とその文書が属している複数のクラスのクラスラベルとが対応付けて格納されたクラスラベル付き文書データベース内の、前記文書を単語に分割し、その分割した単語と全クラス各々との関連性を求め、分割した各単語と各クラスの組合せ毎の関連性を格納した拡張特徴表現データベースを構築する特徴拡張手段と、 前記クラスラベル付き文書データベースの各文書に対して、前記拡張特徴表現データベース内の単語とクラスの関連性を文書特徴表現のデータとして付与し、拡張特徴表現付きクラスラベル付き文書データベースを構築し、クラスラベルが未知である文書が格納されたクラス未知文書データベースの各文書に対して、前記拡張特徴表現データベース内の単語とクラスの関連性を文書特徴表現のデータとして付与し、拡張特徴表現付き文書データベースを構築する拡張特徴表現付与手段と、 前記拡張特徴表現付きクラスラベル付き文書データベースの文書特徴表現およびクラスラベルのデータに基づいて学習を行って、クラス分類モデルを生成する学習手段と、 前記学習手段によって生成されたクラス分類モデルを用いて、前記拡張特徴表現付き文書データベース内のクラスラベルの未知文書がどのクラスに属するのかを推定し、クラスラベル未知文書に推定クラスラベルを付与する推定手段と、 を備えたことを特徴とする文書分類装置。
IPC (1件):
G06F 17/30 ( 200 6.01)
FI (2件):
G06F 17/30 210 D ,  G06F 17/30 170 A

前のページに戻る