特許
J-GLOBAL ID:200903068080146514

言語処理装置及びそのプログラム記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 小笠原 吉義 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-048092
公開番号(公開出願番号):特開2000-250905
出願日: 1999年02月25日
公開日(公表日): 2000年09月14日
要約:
【要約】【課題】本発明は、言語処理装置及びそのプログラム記憶媒体に関し、言語を高い正解率で自動的に認識することを目的とする。【解決手段】 特徴素抽出部11は、学習対象テキスト14から言語に応じた特徴素を抽出し、その出現頻度を算出する。情報量計算部12は出現頻度を情報量に変換する。テーブル出力部13は特徴素とその情報量とからなるテーブル17を作成する。特徴素抽出部21は、認識対象テキスト24から特徴素を抽出し、その出現頻度を算出する。情報量計算部22は、この出現頻度を用いてテーブル17を参照して出現頻度を情報量に変換し、これを用いて平均情報量を算出する。判定部23は、平均情報量が閾値以下であってかつ閾値に最も近い言語で、認識対象テキスト24が記述されていると判定する。
請求項(抜粋):
学習テキストから言語毎に当該言語に応じた特徴素を抽出し、抽出した全ての特徴素についての出現頻度及び特徴素毎の出現頻度を算出する特徴素抽出部と、前記特徴素抽出部の算出した全ての特徴素についての出現頻度及び特徴素毎の出現頻度を、各々、情報量に変換する情報量計算部と、前記特徴素抽出部の抽出した全ての特徴素と、特徴素の各々に対応する前記情報量計算部の算出した情報量とからなるテーブルを作成して出力するテーブル出力部とを備えることを特徴とする言語処理装置。
Fターム (4件):
5B091AA01 ,  5B091AA15 ,  5B091CA00 ,  5B091EA01

前のページに戻る