特許
J-GLOBAL ID:200903099868924588
情報分類装置および情報分類方法
発明者:
出願人/特許権者:
代理人 (4件):
宮崎 昭夫
, 岩田 慎一
, 緒方 雅昭
, 石橋 政幸
公報種別:公開公報
出願番号(国際出願番号):特願2003-432458
公開番号(公開出願番号):特開2005-190284
出願日: 2003年12月26日
公開日(公表日): 2005年07月14日
要約:
【課題】テキストデータをカテゴリ別に的確に分類可能とし、さらに、分類を実行するための各カテゴリの定義付けを効率的かつ的確に実行可能とする【解決手段】テキストデータをカテゴリ別に分類する情報分類装置は、取り込んだテキストデータから単語情報、係り受け情報をそれぞれ作成する文章解析手段11、係り受け解析手段と、各テキストデータを、当該テキストデータに含まれる単語情報および係り受け情報と分類用辞書記憶手段に記憶された分類用辞書データに基づいてカテゴリ別に分類するデータ分類手段12を有している。分類用辞書データとしては、分類用辞書データ作成手段30を用いて、全てのテキストデータについての、作成された単語情報と係り受け情報のうちから指定されたものが、指定されたカテゴリに分類するための条件として登録される。【選択図】図1
請求項(抜粋):
分類対象とするテキストデータをカテゴリ別に分類する情報分類装置であって、
前記テキストデータを取り込むデータ入力手段と、
前記データ入力手段によって取り込んだ前記テキストデータの文章を形態素解析し、該文章を単語に分け品詞情報を付与した単語情報を作成する文章解析手段と、
前記文章解析手段によって作成された前記単語情報に基づいて、各単語間の主語と述語の関係、または修飾語と被修飾語の関係である係り受け関係を判定し、係り受け情報を作成する係り受け解析手段と、
前記各カテゴリ別に、当該カテゴリに分類する条件となる、前記テキストデータが含むべき前記単語情報と前記係り受け情報が登録された分類用辞書データを記憶する分類用辞書記憶手段と、
前記各テキストデータを、当該テキストデータに含まれる前記単語情報および前記係り受け情報と前記分類用辞書記憶手段に記憶された前記分類用辞書データに基づいて前記カテゴリ別に分類するデータ分類手段とを有し、
前記分類用辞書データを前記分類用辞書記憶手段に登録する手段として、サンプルテキストデータについての、前記文章解析手段によって作成された前記単語情報と、前記係り受け解析手段によって作成された前記係り受け情報のうちから指定されたものを、指定された前記カテゴリに分類するための条件として前記分類用辞書データに登録する分類用辞書データ作成手段をさらに有する情報分類装置。
IPC (2件):
FI (4件):
G06F17/30 210D
, G06F17/30 170A
, G06F17/30 220Z
, G06F17/27 J
Fターム (6件):
5B075ND03
, 5B075NK46
, 5B075NR12
, 5B075UU01
, 5B091AA15
, 5B091CA05
引用特許:
出願人引用 (9件)
全件表示
審査官引用 (4件)