特許
J-GLOBAL ID:200903017187123467

文書分類装置、方法、プログラム

発明者:
出願人/特許権者:
代理人 (1件): 大西 昭広
公報種別:公開公報
出願番号(国際出願番号):特願2004-299229
公開番号(公開出願番号):特開2006-113746
出願日: 2004年10月13日
公開日(公表日): 2006年04月27日
要約:
【課題】 様々な商品や物事についての意見を含んだ文書を、二つのカテゴリーに大別する場合に従来技術では、分野を狭く限定し、データを新聞記事等の文章に固定し、特定の表現や判定のためのルールを抽出することによって文書の分類および、意味的情報の判定を行っている。従って、一つの分野・領域で抽出したルールを他の分野に適用することは困難であり、期待した精度での分類は出来ないと考えられる。【解決手段】 本願発明では、文書を肯定的内容・否定的内容のカテゴリーに分類する事例を用い、基本的表現リストに加え、非自立的要素のNグラムによって否定・肯定の含意を含む連語を利用することにより、様々の分野・領域における意見を含む文書について特定の分野・領域に限定せず、広い分野・領域に適用可能な方法等を提案する。【選択図】図3
請求項(抜粋):
以下の(a)及び(b)の手段を有し、入力文書を2つのカテゴリーに分類する装置、 (a)前記入力文書から、所定の非自立的要素を含む連語の発生頻度をもとに、文書素性ベクトルを作成する手段、 (b)前記文書素性ベクトルを用いて、判別式により前記入力文書を分類する手段。
IPC (1件):
G06F 17/30
FI (3件):
G06F17/30 210D ,  G06F17/30 170A ,  G06F17/30 414B
Fターム (5件):
5B075ND03 ,  5B075NK32 ,  5B075NR12 ,  5B075QS01 ,  5B075UU06
引用特許:
出願人引用 (9件)
全件表示
審査官引用 (8件)
全件表示

前のページに戻る