特許
J-GLOBAL ID:200903014431039610

単語分類装置、単語分類方法及び単語分類プログラム

発明者:
出願人/特許権者:
代理人 (1件): 工藤 宣幸
公報種別:公開公報
出願番号(国際出願番号):特願2003-133140
公開番号(公開出願番号):特開2004-334766
出願日: 2003年05月12日
公開日(公表日): 2004年11月25日
要約:
【課題】少ない工数で任意のカテゴリに分類対象単語を分類できる単語分類装置、方法及びプログラムを提供する。【解決手段】本発明の単語分類装置及び方法では、各カテゴリについて、そのカテゴリを代表する単語であるコアワードと、そのコアワードがそのカテゴリに属する度合いを示す値の組を複数格納しているコアワード辞書と、文書を格納している文書データベースとを用意しておき、文書データベースの格納文書から分類対象単語を検索し、さらに、その共起関係にある単語を抽出する。そして、抽出された各共起関係単語が、コアワード辞書にコアワードとして格納されているかを検索し、検索されたコアワードの値から、カテゴリの順位付け判定値を形成して、分類対象単語が属するカテゴリを決定する。本発明の単語分類プログラムは、上述の単語分類方法をコンピュータ実行可能なコードで記述している。【選択図】 図1
請求項(抜粋):
分類対象単語を複数のカテゴリのいずれかのカテゴリに分類する単語分類装置であって、 各カテゴリについて、そのカテゴリを代表する単語であるコアワードと、そのコアワードがそのカテゴリに属する度合いを示すコアワード値の組を複数格納しているコアワード辞書と、 文書を格納している文書データベースと、 上記文書データベースに格納されている文書から、上記分類対象単語を検索し、分類対象単語が検索された文書部分から、その共起関係にある共起関係単語を抽出する文書処理手段と、 抽出された各共起関係単語が、上記コアワード辞書にコアワードとして格納されているかを検索し、検索されたコアワードのコアワード値から、カテゴリの順位付け判定値を形成して、上記分類対象単語が属するカテゴリを決定する判定手段と を有することを特徴とする単語分類装置。
IPC (1件):
G06F17/30
FI (3件):
G06F17/30 210D ,  G06F17/30 170A ,  G06F17/30 320D
Fターム (5件):
5B075ND03 ,  5B075NK35 ,  5B075NR12 ,  5B075PR04 ,  5B075UU01
引用特許:
出願人引用 (5件)
全件表示
審査官引用 (5件)
全件表示

前のページに戻る