特許
J-GLOBAL ID:200903040999253374
文字置換方法および装置
発明者:
出願人/特許権者:
代理人 (1件):
若林 忠
公報種別:公開公報
出願番号(国際出願番号):特願平6-310871
公開番号(公開出願番号):特開平8-166952
出願日: 1994年12月14日
公開日(公表日): 1996年06月25日
要約:
【要約】【目的】 日本語漢字かな混じりの文章に対する形態素解析処理の前処理としての文字置換方法を提供し、入力文章中で「ー」(長音)や「-」(マイナス)が混同してあるいは代用して使用されていても、形態素解析の精度を維持し、形態素解析の負担を低減できるようにする。【構成】文分割処理部21により、入力文章1の表層上の情報を用いて、処理単位となる文に入力文章1を分割する。置換処理部22において、1文単位に、「-」(マイナス)と「ー」(長音)の文字を検出し、当該文における表層上の情報を用いていずれの種類の表現中に「-」(マイナス)と「ー」(長音)の各文字が存在するかを判定し、判定結果に応じ、「-」(マイナス)、「ー」(長音)、「-」(ハイフン)および「-」(ダッシュ)の文字のうち当該表現において適切な文字に、検出された「-」(マイナス)と「ー」(長音)の文字を置換する。
請求項(抜粋):
日本語漢字かな混じりの文章を入力して、入力文章中の不適切文字に対し適切な文字への置換処理を行った後、形態素解析を行い、その結果を出力する言語解析処理における文字置換方法において、前記入力文章の表層上の情報を用いて、処理単位となる文に前記入力文章を分割する文分割処理工程と、前記文分割処理工程により設定された1文単位に、「-」(マイナス)と「ー」(長音)の文字を検出し、当該文における表層上の情報を用いていずれの種類の表現中に「-」(マイナス)と「ー」(長音)の各文字が存在するかを判定し、前記判定結果に応じ、「-」(マイナス)、「ー」(長音)、「-」(ハイフン)および「-」(ダッシュ)の文字のうち当該表現において適切な文字に、検出された「-」(マイナス)と「ー」(長音)の文字を置換する置換処理工程と、を有することを特徴とする文字置換方法。
FI (2件):
G06F 15/20 550 J
, G06F 15/38 E
引用特許:
前のページに戻る