特許
J-GLOBAL ID:200903009862695685

キーワード決定データベース作成方法、キーワード決定方法、装置、プログラム、および記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 金田 暢之 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2002-063867
公開番号(公開出願番号):特開2003-263441
出願日: 2002年03月08日
公開日(公表日): 2003年09月19日
要約:
【要約】【課題】 どのような分野のテキストに対してもロバストにキーワードを決定する。【解決手段】 内容語選択部2は、入力されたテキストの単語のうち特定の品詞を持つ単語を内容語として選択する。重要度算出部3は、得られたテキストと要約の内容語の間で一致または類似した単語を対応付けし、テキスト中の内容語のうち要約中の内容語と対応付けられたものをキーワードに必要な内容語として、対応付けられなかったものを不要な内容語として分類し、テキスト中の内容語に関する様々な言語的情報から、必要な内容語の場合は正の重要度を、不要な内容語の場合は負の重要度を出力する重要語選択モデルを学習し、DB4に出力する。重要度付与部5は、得られた重要語選択モデルを用いてテキストの内容語に重要度を付与する。キーワード出力部6は、重要度が付与された内容語を、重要度の高いものから順に指定された個数キーワードとして出力する。
請求項(抜粋):
主テキストと要約テキストを構成する文それぞれについて形態素解析して単語とその品詞、係り受けを含む言語的情報を分析するステップと、分析された特定の品詞の単語のうち、主テキストと要約テキストの両者に存在する単語を対応付けるステップと、各単語の言語的情報の要素値からなるベクトルについて、対応付けられた単語と対応付けられなかった単語各々についてベクトル空間での座標を分類する分類面を算出するステップと、対応付けられた単語について分類面からの距離を単語の重要度として算出するステップと、対応付けられた単語について各言語的情報の要素値からなるベクトルと重要度とを対応付けたデータベースを作成するステップを有するキーワード決定データベース作成方法。
IPC (4件):
G06F 17/30 210 ,  G06F 17/30 170 ,  G06F 17/30 220 ,  G06F 17/30 350
FI (5件):
G06F 17/30 210 A ,  G06F 17/30 170 A ,  G06F 17/30 210 D ,  G06F 17/30 220 Z ,  G06F 17/30 350 C
Fターム (7件):
5B075ND03 ,  5B075NK32 ,  5B075NR12 ,  5B075PQ75 ,  5B075PR06 ,  5B075PR08 ,  5B075QM08
引用特許:
審査官引用 (2件)

前のページに戻る