Pat
J-GLOBAL ID:200903068080146514

言語処理装置及びそのプログラム記憶媒体

Inventor:
Applicant, Patent owner:
Agent (1): 小笠原 吉義 (外2名)
Gazette classification:公開公報
Application number (International application number):1999048092
Publication number (International publication number):2000250905
Application date: Feb. 25, 1999
Publication date: Sep. 14, 2000
Summary:
【要約】【課題】本発明は、言語処理装置及びそのプログラム記憶媒体に関し、言語を高い正解率で自動的に認識することを目的とする。【解決手段】 特徴素抽出部11は、学習対象テキスト14から言語に応じた特徴素を抽出し、その出現頻度を算出する。情報量計算部12は出現頻度を情報量に変換する。テーブル出力部13は特徴素とその情報量とからなるテーブル17を作成する。特徴素抽出部21は、認識対象テキスト24から特徴素を抽出し、その出現頻度を算出する。情報量計算部22は、この出現頻度を用いてテーブル17を参照して出現頻度を情報量に変換し、これを用いて平均情報量を算出する。判定部23は、平均情報量が閾値以下であってかつ閾値に最も近い言語で、認識対象テキスト24が記述されていると判定する。
Claim (excerpt):
学習テキストから言語毎に当該言語に応じた特徴素を抽出し、抽出した全ての特徴素についての出現頻度及び特徴素毎の出現頻度を算出する特徴素抽出部と、前記特徴素抽出部の算出した全ての特徴素についての出現頻度及び特徴素毎の出現頻度を、各々、情報量に変換する情報量計算部と、前記特徴素抽出部の抽出した全ての特徴素と、特徴素の各々に対応する前記情報量計算部の算出した情報量とからなるテーブルを作成して出力するテーブル出力部とを備えることを特徴とする言語処理装置。
F-Term (4):
5B091AA01 ,  5B091AA15 ,  5B091CA00 ,  5B091EA01

Return to Previous Page