Pat
J-GLOBAL ID:200903007123488326
文書校正装置およびプログラム記憶媒体
Inventor:
,
Applicant, Patent owner:
Agent (2):
小笠原 吉義
, 山谷 晧榮
Gazette classification:公開公報
Application number (International application number):2006207617
Publication number (International publication number):2006338682
Application date: Jul. 31, 2006
Publication date: Dec. 14, 2006
Summary:
【課題】日本語文書等における誤りを指摘する文書校正装置およびプログラム記憶媒体に関し,文書中の誤り箇所の過剰指摘を防止し,ユーザの判断を軽減させて,校正作業効率を向上させることを目的とする。【解決手段】複数の誤り確率計算部2a,2b,...は,それぞれ異なる誤り確率計算手法により誤り確率値を計算する。誤り確率保存部3はこれらの誤り確率値を集計し,原テキストの各文字または文字列に対して,集計した誤り確率値を付与する。誤り候補抽出部5は所定の誤り確率閾値4を超える誤り確率値を持つ文字または文字列を誤り候補として抽出する。誤り表示処理部6は,抽出された誤り候補を校正用のテキスト中に下線付き表示または色違い表示等により表示する。【選択図】図1
Claim (excerpt):
テキスト文書における誤りを指摘する文書校正装置において,
テキストの各構成文字または文字列に対して所定の異なる誤り確率計算手法により誤り確率値を計算し,それぞれ計算された誤り確率値を付与する複数の誤り確率計算手段と,
前記複数の誤り確率計算手段から各々得た誤り確率値を集計し,各構成文字または文字列に対する最終的な誤り確率値を定める誤り確率保存手段と,
前記テキストの各構成文字または文字列に対して付与された誤り確率値と,外部から設定された誤り確率閾値または予め定められた誤り確率閾値との大小の比較により,誤り候補を抽出する誤り候補抽出手段と,
抽出された誤り候補を出力する誤り表示処理手段とを備え,
かつ,前記複数の誤り確率計算手段の中に,
テキストを形態素解析して単語列に分割する形態素解析手段と,
分割された単語列のうち,所定の単語辞書に未登録の部分に対して所定の誤り確率値を付与する未登録語検出手段と,
分割された単語列に対して,その単語列が,未登録語と特定の品詞または特定の単語が並ぶパターンであって,予め解析用データとして登録されたパターンと一致するか否かを判定し,一致する場合に,前記未登録語検出手段が未登録語に対して付与した誤り確率値を低くするような負の誤り確率値を付与する特定パターン検出手段とを持つ誤り確率計算手段を有する
ことを特徴とする文書校正装置。
IPC (3):
G06F 17/21
, G06F 17/24
, G06F 17/28
FI (3):
G06F17/21 550J
, G06F17/24 554Z
, G06F17/28 X
F-Term (3):
5B009QB05
, 5B091AA11
, 5B091CA02
Return to Previous Page