Pat
J-GLOBAL ID:200903055875423031
ドキュメントデータベースの構築方法、表示方法、及び表示装置
Inventor:
Applicant, Patent owner:
Agent (1):
遠山 勉 (外1名)
Gazette classification:公開公報
Application number (International application number):1996087013
Publication number (International publication number):1996314980
Application date: Mar. 04, 1996
Publication date: Nov. 29, 1996
Summary:
【要約】【課題】単語辞書や文法に関する知識を構築することなく、文書内容の分野を限定せずに、文書内容の適確な把握が可能な主題抽出および表現を行う。【解決手段】与えられた文書から主題を示唆し得る共起関係にある自立語群を抽出し、各自立語とそれに対する共起単語との共起回数を算出し、これにより得られた共起確率で共起の強さをネットワークで表すようにした。この結果、大規模な文法辞書を構築することなく文書の手段を抽出でき、要約作成に必要な文法知識をこのネットワーク出力を参照して人間が補ってやることによりこのネットワーク出力からさらに主題抽出、要約生成が可能となり、キーワードのみの情報に較べより詳細な文章把握が可能になった。
Claim (excerpt):
与えられた文書から自立語を抽出する自立語抽出ステップと、 前記で抽出された各自立語に対する共起単語とその共起回数を記録する共起テーブルを作成する共起テーブル作成ステップと、前記共起テーブルに基づいて共起関係の強さを表わす共起確率を算出する共起確率算出ステップと、前記共起テーブルに基づいて共起回数の期待値を算出する共起回数期待値算出ステップと、前記期待値と前記共起回数とを比較して文書の主題を示唆し得る共起関係にある自立語群を選定する主題示唆自立語群選定ステップと、前記で選定された主題を示唆する共起関係にある自立語間にリンクを設定するとともに、リンクの表現形式を前記共起確率に基づいて決定した共起ネットワークとして表示する共起ネットワーク生成ステップとを含むドキュメントデータベースの構築方法。
FI (3):
G06F 15/419 320
, G06F 15/401 310 C
, G06F 15/403 330 C
Return to Previous Page