特許
J-GLOBAL ID:201703007740969334
文書分類装置、文書分類方法、文書分類プログラム
発明者:
,
,
,
,
出願人/特許権者:
代理人 (4件):
小林 博通
, 鵜澤 英久
, 山口 幸二
, 橋本 剛
公報種別:特許公報
出願番号(国際出願番号):特願2014-054258
公開番号(公開出願番号):特開2015-176511
特許番号:特許第6078491号
出願日: 2014年03月18日
公開日(公表日): 2015年10月05日
請求項(抜粋):
【請求項1】 文書を文書内容に応じてクラスに分類する文書分類装置であって、
外部文書から任意の単語ペアを抽出して単語ペアデータを生成する単語ペアデータ生成部と、
クラスラベルの付されたラベル付き文書に文書特徴表現を付与して特徴付きラベル付き文書とする一方、クラスラベルの未知なラベル無し文書に文書特徴表現を付与して特徴付きラベル無し文書とする特徴付与部と、
特徴付きラベル付き文書を単語に分割し、各単語ペアデータ中において前記分割された単語とペアの他の単語群を用いて擬似特徴表現を定め、定められた擬似特徴表現を特徴付きラベル付き文書に付与して擬似特徴付きラベル付き文書とする擬似特徴付与部と、
擬似特徴付きラベル付き文書を用いて学習して生成したクラス分類モデルに基づき特徴付きラベル無し文書のラベルを推定する推定部と、
を備えることを特徴とする文書分類装置。
IPC (1件):
FI (2件):
G06F 17/30 210 D
, G06F 17/30 170 A
前のページに戻る