特許
J-GLOBAL ID:201003046810490540
文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム
発明者:
,
,
,
,
,
出願人/特許権者:
,
代理人 (2件):
石川 泰男
, 奥 和幸
公報種別:公開公報
出願番号(国際出願番号):特願2009-039999
公開番号(公開出願番号):特開2010-198141
出願日: 2009年02月23日
公開日(公表日): 2010年09月09日
要約:
【課題】文書中の情報を的確に分類するように、文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラムを提供する。【解決手段】本発明は、文書から語句を抽出し(S1)、語句を分類するためのカテゴリを設定し(S2)、語句の中からカテゴリに関連した基準語句を設定し(S3)、基準語句と共に出現する共起語句を文書から抽出し(S4)、語句のうち分類の対象となる配属候補語句と共起語句との共起関連性に基づき、配属候補語句に対してカテゴリへの配属スコアを算出し(S11)、配属スコアに基づき配属候補語句をカテゴリに配属させ(S12)、カテゴリに配属された配属候補語句をカテゴリに関連付けてデータベースに記憶する。【選択図】図7
請求項(抜粋):
語句を分類するためのカテゴリを設定するカテゴリ設定手段と、
前記カテゴリごとに1または2以上の基準語句の入力を受け付け、当該基準語句を初期基準語句として設定する基準語句設定手段と、
前記初期基準語句と共に出現する共起語句を文書から抽出する共起語句抽出手段と、
前記初期基準語句と前記共起語句をデータベースに記憶する第一記憶手段と、
前記文書から前記カテゴリへの配属候補となる語句を抽出する語句抽出手段と、
前記配属候補語句について、前記共起語句との共起関連性に基づき前記カテゴリへの配属スコアを算出する配属スコア算出手段と、
前記配属スコアに基づき前記配属候補語句を前記カテゴリに配属を決定する配属決定手段と、
前記配属決定手段によって前記カテゴリに配属された前記配属候補語句を前記カテゴリに関連付けて前記データベースに記憶する第二記憶手段と、
を備えたこと特徴とするデータベースの作成装置。
IPC (1件):
FI (2件):
G06F17/30 210D
, G06F17/30 170A
Fターム (2件):
前のページに戻る