特許
J-GLOBAL ID:200903017969897208

文書処理装置

発明者:
出願人/特許権者:
代理人 (1件): 高野 明近
公報種別:公開公報
出願番号(国際出願番号):特願平11-036890
公開番号(公開出願番号):特開2000-235574
出願日: 1999年02月16日
公開日(公表日): 2000年08月29日
要約:
【要約】【課題】 話題が混在した新聞記事などの電子化文書から、話題ごとに文書を分割する。【解決手段】 電子化文書を、段落に分けて段落間の関連度を求め、この関連度を例えばマトリクスに表示して、任意番目の行と任意番目の列と対角成分とで囲まれる三角形領域とし、この三角形領域内の関連度の合計値を求め、この合計値より分割点を求める。例えば、三角形領域内の関連度の合計値とこの三角形の列を1辺とし任意番目の行を1辺とする矩形領域内の関連度の合計値を求め、これら三角形領域の合計値と矩形領域の合計値の比を求め、この比の値に基づいて文書を分割する。
請求項(抜粋):
電子化された文書を段落に分割し、上記段落から抽出されたキーワードに基づいて段落間の関連度を計算し、段落を次元とする正方行列において、該正方行列の対角成分を境として片側の領域の各成分に上記関連度を入れ、該関連度を入れた前記片側領域において、任意番目の行(又は列)と、任意番目の列(又は行)と、対角成分と、で囲まれる三角形領域内の関連度の合計値を求め、該関連度の合計値に基づいて文書の分割点を求めることを特徴とする文書処理装置。
IPC (2件):
G06F 17/27 ,  G06F 17/30
FI (4件):
G06F 15/20 550 A ,  G06F 15/38 D ,  G06F 15/40 370 A ,  G06F 15/401 320 A
Fターム (10件):
5B009QA05 ,  5B075NR02 ,  5B075NR12 ,  5B075NS01 ,  5B075UU05 ,  5B091AA11 ,  5B091CA01 ,  5B091DA02 ,  5B091DA07 ,  5B091EA11

前のページに戻る