特許
J-GLOBAL ID:201103075070193730

文書分類装置およびプログラム

発明者:
出願人/特許権者:
代理人 (18件): 蔵田 昌俊 ,  河野 哲 ,  中村 誠 ,  福原 淑弘 ,  峰 隆司 ,  白根 俊郎 ,  村松 貞男 ,  野河 信久 ,  幸長 保次郎 ,  河野 直樹 ,  砂川 克 ,  勝村 紘 ,  佐藤 立志 ,  岡田 貴志 ,  堀内 美保子 ,  竹内 将訓 ,  市原 卓三 ,  山下 元
公報種別:公開公報
出願番号(国際出願番号):特願2010-065156
公開番号(公開出願番号):特開2011-198137
出願日: 2010年03月19日
公開日(公表日): 2011年10月06日
要約:
【課題】ユーザによる移動操作の対象外の文書であっても、精度よく再分類することを可能とする。【解決手段】文書移動処理部321は、文書を移動元カテゴリから移動先カテゴリに移動する。再分類候補決定部322は、階層構造における移動元カテゴリおよび移動先カテゴリの位置に基づいて再分類先カテゴリを決定する。再分類候補決定部322は、再分類先カテゴリに属する文書を再分類対象文書として決定する。半教師文書決定部323は、移動された文書の特徴を表す第1のベクトル、再分類先カテゴリの特徴を表す第2のベクトルおよび再分類対象文書の特徴を表す第3のベクトルに基づいて再分類対象文書の中から再分類先カテゴリの半教師文書を決定する。再分類部324は、移動された文書および再分類先カテゴリの半教師文書に基づいて再分類対象文書を再分類先カテゴリに分類する。【選択図】図2
請求項(抜粋):
単語を含む複数の文書であって、階層構造を構成する複数のカテゴリの各々に属する複数の文書を再分類する文書分類装置において、 前記カテゴリ毎に、当該カテゴリを識別するためのカテゴリ識別情報および当該カテゴリに属する文書を対応づけて記憶する記憶手段と、 ユーザの操作に応じて、当該ユーザによって指定された移動元カテゴリに属する文書を当該移動元カテゴリとは異なる移動先カテゴリに移動する文書移動処理手段と、 前記複数のカテゴリによって構成される階層構造における前記移動元カテゴリおよび前記移動先カテゴリの位置に基づいて、当該複数のカテゴリの中から文書の分類先となる再分類先カテゴリを決定する再分類先カテゴリ候補決定手段と、 前記再分類先カテゴリ候補決定手段によって決定された再分類先カテゴリを識別するためのカテゴリ識別情報に対応づけて前記記憶手段に記憶されている文書を再分類対象文書として決定する再分類対象文書決定手段と、 前記文書移動処理手段によって移動された文書の特徴を表す第1のベクトル、前記再分類先カテゴリ候補決定手段によって決定された再分類先カテゴリの特徴を表す第2のベクトルおよび前記再分類対象文書決定手段によって決定された再分類対象文書の特徴を表す第3のベクトルに基づいて、前記再分類対象文書決定手段によって決定された再分類対象文書の中から前記再分類先カテゴリ候補対象文書決定手段によって決定された再分類先カテゴリの半教師文書を決定する半教師文書決定手段と、 前記文書移動処理手段によって移動された文書および前記半教師文書決定手段によって決定された再分類先カテゴリの半教師文書に基づいて、前記再分類対象文書決定手段によって決定された再分類対象文書を前記再分類先カテゴリ候補決定手段によって決定された再分類先カテゴリに分類する再分類手段と を具備することを特徴とする文書分類装置。
IPC (1件):
G06F 17/30
FI (2件):
G06F17/30 210D ,  G06F17/30 170A
Fターム (3件):
5B075ND03 ,  5B075NR02 ,  5B075QM07
引用特許:
審査官引用 (3件)
  • 文書の分類器を生成する方法とそのシステム
    公報種別:公開公報   出願番号:特願2009-097929   出願人:エヌイーシー(チャイナ)カンパニー,リミテッド
  • 文書分類装置
    公報種別:公開公報   出願番号:特願2008-148389   出願人:株式会社東芝, 東芝ソリューション株式会社
  • 文書分類装置
    公報種別:公開公報   出願番号:特願2008-148390   出願人:株式会社東芝, 東芝ソリューション株式会社
引用文献:
前のページに戻る