特許
J-GLOBAL ID:200903018522043526

要約文作成システム及びその方法

発明者:
出願人/特許権者:
代理人 (1件): 上柳 雅誉 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-101301
公開番号(公開出願番号):特開2002-297635
出願日: 2001年03月30日
公開日(公表日): 2002年10月11日
要約:
【要約】【課題】 複数の課題を含む文章を要約文作成する際に、冗漫でなくできるようにしたシステムが望まれていた。【解決手段】 各文内に含まれる名詞や形容動詞等に限定した単語別の使用頻度等により決まる単語の重み付けを比較することにより、前記文章に含まれる単語別の重要度を計算し、前記文章ベクトルに対する各文毎のベクトルをベクトル内積計算値、前記文章ベクトルに近い度合いを比較し、それに応じて、複数の文に対する重要性を序列付けて重要性識別し、前記文章ベクトルから重要性の高い順にベクトル減算することにより順次新たな文章ベクトルを生成し、その新たな文章ベクトルに所定の要約率による要約及び補正し、要約された複数の文を元通りの順番に整列させ接続詞及び指示代名詞を削除又は指定語句へ変換することにより、自然さを確保する。
請求項(抜粋):
入力された文章を文に区切り単語に分割する形態素解析ステップ(S1)と、前記文の中から名詞と形容動詞及びそれらに類する単語を抽出する単語抽出ステップ(S2)と、前記単語の夫々を座標軸とする多次元ベクトル空間に前記単語の使用頻度及び/又は重要性の重み付けに応じてベクトルマップした単語ベクトルを設定し文ベクトルを計算する文ベクトル計算ステップ(S3)と、その文ベクトル計算ステップ(S3)を文章中に含まれる全ての文に対して徹底させる徹底ステップ(S4)と、前記文ベクトル計算ステップ(S3)と同様だが文章全体の単語に対して計算した単語ベクトルを文章全体のベクトルとする文章ベクトル計算ステップ(S5)と、前記文ベクトルの夫々と前記文章ベクトルの内積を計算するベクトル内積計算ステップ(S6)と、そのベクトル内積計算ステップ(S6)の計算値のうち最大値をもたらす文を抽出して重要文の候補とする内積値最大文抽出ステップ(S7)と、前記重要文のベクトルを前記文章ベクトルから引くことにより文章を補正する文章ベクトル補正ステップ(S8)と、それらのベクトル内積計算ステップ(S6)から内積値最大文抽出ステップ(S7)及び文章ベクトル補正ステップ(S8)でなる三ステップを適宜繰り返すことにより設定自在の要約率に到達させる要約率達成ステップ(S9)と、複数の重要文が得られた場合に元の文章の並び順を踏襲して整列し接続詞及び/又は指示代名詞が有れば指定の語句に置換又は削除して自然さを確保する出力文章整形ステップ(S10)を実行することを特徴とする要約文作成システム及びその方法。
IPC (3件):
G06F 17/30 220 ,  G06F 17/30 170 ,  G06F 17/30 340
FI (3件):
G06F 17/30 220 A ,  G06F 17/30 170 A ,  G06F 17/30 340 B
Fターム (6件):
5B075ND03 ,  5B075NK32 ,  5B075NS01 ,  5B075PR04 ,  5B075PR08 ,  5B075QM05

前のページに戻る