特許
J-GLOBAL ID:200903004170257970

文書データ処理方法及び処理装置とその処理プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 酒井 昭徳
公報種別:公開公報
出願番号(国際出願番号):特願平10-283432
公開番号(公開出願番号):特開平11-191105
出願日: 1998年09月18日
公開日(公表日): 1999年07月13日
要約:
【要約】【課題】 文書データ中に含まれている文章構成上不要な空白文字コード及び改行コードを適切・確実に削除して、論理的に連続する段落を生成する。【解決手段】 文書データの改行コードによって形式的に区切られる一連の文字コード列を形式段落とし、その各段落種別の判定に必要な情報を段落情報設定手段21によって設定する。その各形式段落の段落情報によって、段落種別判定手段22が段落種別を判定して各形式段落に段落種別情報を付与する。論理段落生成手段が、連続する複数の形式段落の段落種別情報及び段落情報を参照して、各形式段落の段落種別を順次確定し、その段落種別に応じて各段落内の不要な空白文字コード及び改行コードを削除して、論理的に連続する論理段落を生成し、その情報を論理段落情報格納手段24に格納する。
請求項(抜粋):
空白文字コードを含む各種文字コードと段落を形成する改行コードが配列された文書データから、文章構成上不要な空白文字コード及び不要な改行コードを削除する文書データ処理方法であって、前記文書データにおける前記改行コードによって形式的に区切られる一連の文字コード列を形式段落とし、その形式段落中の文字コードが空白文字コードのみからなる場合は空白段落、その形式段落が見出し又は箇条書きとして使われている場合は見出し・箇条書き段落、その形式段落が独立した文章を構成している場合は完全段落、その形式段落が独立した文章の一部となっている場合は不完全段落として、各形式段落の段落種別を判定し、前記空白段落に対しては該段落内の全ての空白文字コードを削除して1論理段落とするかあるいは該段落全体を削除し、前記見出し・箇条書き段落に対しては処理を加えずに1形式段落を1論理段落とし、前記完全段落に対しては不要な空白文字コードを削除して1形式段落を1論理段落とし、前記不完全段落に対しては不要な空白文字コードを削除すると共に、連続する不完全段落の終端の直前の段落までの各段落の改行コードを削除し、その連続する複数の不完全段落を結合して1論理段落とすることにより、論理段落を生成することを特徴とする文書データ処理方法。
IPC (2件):
G06F 17/24 ,  G06F 17/27
FI (4件):
G06F 15/20 554 C ,  G06F 15/20 550 E ,  G06F 15/20 550 F ,  G06F 15/38 E
引用特許:
審査官引用 (8件)
  • 特開平3-233670
  • 文書整形装置
    公報種別:公開公報   出願番号:特願平2-418630   出願人:カシオ計算機株式会社
  • 文書整形装置
    公報種別:公開公報   出願番号:特願平6-189039   出願人:カシオ計算機株式会社
全件表示

前のページに戻る