特許
J-GLOBAL ID:201703001151990414

分類付与方法および分類付与システム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人藤央特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2015-084192
公開番号(公開出願番号):特開2016-206748
出願日: 2015年04月16日
公開日(公表日): 2016年12月08日
要約:
【課題】上位分類が付与された文書に対する下位分類の付与精度を向上させる。【解決手段】分類付与システムは、分類付与対象文書のテキスト内容の特徴を示す特徴語と、抽出した特徴語それぞれの前記分類付与対象文書における重要度を示す重みと、を含む特徴情報を生成し、特徴情報に含まれる特徴語それぞれに対して、下位分類の付与対象のとしてフォーカスされた上位分類である第1分類の当該特徴語の分類重みと、第1分類の上位分類でなくかつ下位分類でない1以上の分類からなる、第1分類群の分類の当該特徴語の分類重みそれぞれと、の比較を行い、比較の結果が所定の条件を満たす場合、特徴情報に含まれる当該特徴語及び当該特徴語の重みの削除、又は比較において用いられた分類重みに基づく、特徴情報に含まれる当該特徴語の重みの変更を行う。【選択図】図1
請求項(抜粋):
分類付与システムが、階層構造を持つ分類体系における複数の分類が付与された分類付与対象文書に、前記複数の分類に含まれる第1分類、の下位分類を付与する方法であって、 前記複数の分類は、前記第1分類の上位分類でなくかつ下位分類でない1以上の分類、からなる第1分類群を含み、 前記分類付与システムは、 前記分類体系に含まれる分類と、当該分類の特徴を示す特徴語と、当該特徴語の当該分類における重要度を示す分類重みと、の対応を示す分類別特徴語テーブルと、 複数の教師文書それぞれと、当該教師文書に付与された前記第1分類の下位分類と、の対応を示す教師文書-分類対応テーブルと、 前記複数の教師文書それぞれにおける、当該教師文書のテキスト内容の特徴を示す特徴語と、当該教師文書の特徴語それぞれの当該教師文書における重要度を示す重みと、の対応、を示す類似文書検索インデクスと、を保持し、 前記方法は、 前記分類付与システムが、 前記分類付与対象文書のテキスト内容の特徴を示す特徴語を、前記分類付与対象文書から抽出し、 前記抽出した特徴語それぞれの前記分類付与対象文書における重要度を示す重みを、前記分類付与対象文書から算出し、 前記抽出した特徴語と、前記算出した重みと、を特徴情報に含め、 前記特徴情報に含まれる特徴語それぞれに対して、 前記分類別特徴語テーブルを参照して、前記第1分類の当該特徴語の分類重みと、前記第1分類群の分類の当該特徴語の分類重みそれぞれと、の比較を行い、 前記比較の結果が所定の条件を満たす場合、前記特徴情報に含まれる当該特徴語及び当該特徴語の重みの削除、又は前記比較において用いられた分類重みに基づく、前記特徴情報に含まれる当該特徴語の重みの変更、のいずれかの補正を行い、 補正後の特徴情報と、前記類似文書検索インデクスと、に基づいて、前記複数の教師文書から前記分類付与対象文書に類似する教師文書を選択し、 前記教師文書-分類対応テーブルが示す、前記選択した教師文書の前記第1分類の下位分類、に基づいて、前記分類付与対象文書に付与する前記第1分類の下位分類を決定する、方法。
IPC (1件):
G06F 17/30
FI (1件):
G06F17/30 210D

前のページに戻る