Pat
J-GLOBAL ID:200903067705005772
文章処理装置
Inventor:
,
Applicant, Patent owner:
Agent (1):
小橋川 洋二
Gazette classification:公開公報
Application number (International application number):2000102274
Publication number (International publication number):2001290833
Application date: Apr. 04, 2000
Publication date: Oct. 19, 2001
Summary:
【要約】【課題】 英語,日本語等の自然言語の文章から、その文章がトピックとしている事柄を正確に反映して抽出することが可能な文章処理装置を提供する。【解決手段】 記憶部10は単語の共起情報を記憶する。入力部20は文章を入力する。形態素解析部30は、入力部から文章を入力し、単語の列に分割する。処理部40は形態素解析部から単語の列を入力する。また、処理部は、記憶部に記憶された単語共起情報を参照し、単語の列における共起し易い単語を単語のクラスタに纏める。処理部は、次に単語のクラスタからなる線形結合モデルを作成し、線形結合モデル中の単語のクラスタの確率を計算する。表示部50は、処理部から確率の高い単語クラスタを入力し、ユーザに表示する。
Claim (excerpt):
自然言語からなる文章における単語間の共起情報を記憶する共起情報記憶手段と、自然言語からなる文章を入力する文章入力手段と、該文章入力手段から入力された前記文章を、単語を単位にして分割する形態素解析手段と、該形態素解析手段が分割した単語に基づいて前記共起情報記憶手段に記憶された共起情報を参照し、前記文章のトピックを抽出するトピック抽出手段とを備えたことを特徴とする文章処理装置。
IPC (3):
G06F 17/30 330
, G06F 17/30 170
, G06F 17/30 350
FI (3):
G06F 17/30 330 C
, G06F 17/30 170 A
, G06F 17/30 350 C
F-Term (7):
5B075ND03
, 5B075NK32
, 5B075NS01
, 5B075PQ02
, 5B075PQ12
, 5B075PQ32
, 5B075QP03
Patent cited by the Patent:
Cited by examiner (1)
-
ドキュメント分類装置及び方法
Gazette classification:公開公報
Application number:特願平8-356219
Applicant:日本電気株式会社
Return to Previous Page