Pat
J-GLOBAL ID:200903096360980025
時系列情報からの固有情報抽出方法および装置,並びに時系列情報からの固有情報抽出プログラムおよびそのプログラムを記録した記録媒体
Inventor:
,
,
Applicant, Patent owner:
Agent (3):
小笠原 吉義
, 森田 寛
, 岡田 光由
Gazette classification:公開公報
Application number (International application number):2002246328
Publication number (International publication number):2004086534
Application date: Aug. 27, 2002
Publication date: Mar. 18, 2004
Summary:
【課題】話題発生時の正確な時間情報を得て,時間情報毎に特徴語を提示することで,大量文書の効率的な時系列閲覧を可能とする。【解決手段】本発明は,話題語を受け取ると,話題語で文書集合を検索し話題語を含む文書を得る。続いて,予定情報や過去情報が記述された文書を排除し,残った文書の作成日などから話題発生時の時間情報を得る。同時に,文書中から人名や場所などの固有表現を得る。そして,時間情報から得た月や日を1単位とし,話題の規模を示す単位毎の文書数を得て,単位毎の出現文書数や単位毎の出現数から話題を特徴付ける固有表現とそのタイプを得る。これら文書数や固有表現・タイプを可視化し時系列表示する。【選択図】 図1
Claim (excerpt):
大量文書から得た特定の話題に関する情報を時間情報に沿って抽出し出力する固有情報抽出方法であって,
話題語を含む文書を検索する過程と,
前記文書の検索結果から話題発生時の時間情報を抽出する過程と,
前記文書の検索結果から固有表現を抽出する過程と,
話題の規模および話題を特徴付ける固有表現に関する情報を時間情報毎に生成する過程とを有する
ことを特徴とする時系列情報からの固有情報抽出方法。
IPC (1):
FI (3):
G06F17/30 370Z
, G06F17/30 170A
, G06F17/30 210A
F-Term (4):
5B075ND03
, 5B075NK32
, 5B075NR12
, 5B075PQ46
Return to Previous Page