特許
J-GLOBAL ID:200903007123488326

文書校正装置およびプログラム記憶媒体

発明者:
出願人/特許権者:
代理人 (2件): 小笠原 吉義 ,  山谷 晧榮
公報種別:公開公報
出願番号(国際出願番号):特願2006-207617
公開番号(公開出願番号):特開2006-338682
出願日: 2006年07月31日
公開日(公表日): 2006年12月14日
要約:
【課題】日本語文書等における誤りを指摘する文書校正装置およびプログラム記憶媒体に関し,文書中の誤り箇所の過剰指摘を防止し,ユーザの判断を軽減させて,校正作業効率を向上させることを目的とする。【解決手段】複数の誤り確率計算部2a,2b,...は,それぞれ異なる誤り確率計算手法により誤り確率値を計算する。誤り確率保存部3はこれらの誤り確率値を集計し,原テキストの各文字または文字列に対して,集計した誤り確率値を付与する。誤り候補抽出部5は所定の誤り確率閾値4を超える誤り確率値を持つ文字または文字列を誤り候補として抽出する。誤り表示処理部6は,抽出された誤り候補を校正用のテキスト中に下線付き表示または色違い表示等により表示する。【選択図】図1
請求項(抜粋):
テキスト文書における誤りを指摘する文書校正装置において, テキストの各構成文字または文字列に対して所定の異なる誤り確率計算手法により誤り確率値を計算し,それぞれ計算された誤り確率値を付与する複数の誤り確率計算手段と, 前記複数の誤り確率計算手段から各々得た誤り確率値を集計し,各構成文字または文字列に対する最終的な誤り確率値を定める誤り確率保存手段と, 前記テキストの各構成文字または文字列に対して付与された誤り確率値と,外部から設定された誤り確率閾値または予め定められた誤り確率閾値との大小の比較により,誤り候補を抽出する誤り候補抽出手段と, 抽出された誤り候補を出力する誤り表示処理手段とを備え, かつ,前記複数の誤り確率計算手段の中に, テキストを形態素解析して単語列に分割する形態素解析手段と, 分割された単語列のうち,所定の単語辞書に未登録の部分に対して所定の誤り確率値を付与する未登録語検出手段と, 分割された単語列に対して,その単語列が,未登録語と特定の品詞または特定の単語が並ぶパターンであって,予め解析用データとして登録されたパターンと一致するか否かを判定し,一致する場合に,前記未登録語検出手段が未登録語に対して付与した誤り確率値を低くするような負の誤り確率値を付与する特定パターン検出手段とを持つ誤り確率計算手段を有する ことを特徴とする文書校正装置。
IPC (3件):
G06F 17/21 ,  G06F 17/24 ,  G06F 17/28
FI (3件):
G06F17/21 550J ,  G06F17/24 554Z ,  G06F17/28 X
Fターム (3件):
5B009QB05 ,  5B091AA11 ,  5B091CA02
引用特許:
出願人引用 (3件)
  • 文章処理装置
    公報種別:公開公報   出願番号:特願平7-050391   出願人:キヤノン株式会社
  • 特開平4-213155
  • 特開昭64-041965
引用文献:
出願人引用 (1件)

前のページに戻る