Pat
J-GLOBAL ID:200903040999253374
文字置換方法および装置
Inventor:
Applicant, Patent owner:
Agent (1):
若林 忠
Gazette classification:公開公報
Application number (International application number):1994310871
Publication number (International publication number):1996166952
Application date: Dec. 14, 1994
Publication date: Jun. 25, 1996
Summary:
【要約】【目的】 日本語漢字かな混じりの文章に対する形態素解析処理の前処理としての文字置換方法を提供し、入力文章中で「ー」(長音)や「-」(マイナス)が混同してあるいは代用して使用されていても、形態素解析の精度を維持し、形態素解析の負担を低減できるようにする。【構成】文分割処理部21により、入力文章1の表層上の情報を用いて、処理単位となる文に入力文章1を分割する。置換処理部22において、1文単位に、「-」(マイナス)と「ー」(長音)の文字を検出し、当該文における表層上の情報を用いていずれの種類の表現中に「-」(マイナス)と「ー」(長音)の各文字が存在するかを判定し、判定結果に応じ、「-」(マイナス)、「ー」(長音)、「-」(ハイフン)および「-」(ダッシュ)の文字のうち当該表現において適切な文字に、検出された「-」(マイナス)と「ー」(長音)の文字を置換する。
Claim (excerpt):
日本語漢字かな混じりの文章を入力して、入力文章中の不適切文字に対し適切な文字への置換処理を行った後、形態素解析を行い、その結果を出力する言語解析処理における文字置換方法において、前記入力文章の表層上の情報を用いて、処理単位となる文に前記入力文章を分割する文分割処理工程と、前記文分割処理工程により設定された1文単位に、「-」(マイナス)と「ー」(長音)の文字を検出し、当該文における表層上の情報を用いていずれの種類の表現中に「-」(マイナス)と「ー」(長音)の各文字が存在するかを判定し、前記判定結果に応じ、「-」(マイナス)、「ー」(長音)、「-」(ハイフン)および「-」(ダッシュ)の文字のうち当該表現において適切な文字に、検出された「-」(マイナス)と「ー」(長音)の文字を置換する置換処理工程と、を有することを特徴とする文字置換方法。
FI (2):
G06F 15/20 550 J
, G06F 15/38 E
Patent cited by the Patent:
Cited by examiner (1)
-
日本語処理の前処理装置
Gazette classification:公開公報
Application number:特願平3-153573
Applicant:富士通株式会社
Return to Previous Page